需要资深python爬虫人员5-8名

具体薪资可面议。
岗位职责:
1、 负责大规模、多终端适配、分布式爬虫系统的设计及开发;
2、 负责网站、网页、公众号链接的特征挖掘,进行数据抓取、提取、清洗、入库;
3、 设计足够通用和灵活的反爬虫策略;
4、 负责爬虫核心算法的优化研究,充分利用资源,避免受限;
5、 对接业务方需求,分配并管理爬虫团队的工作和结果质量验收与交付。
任职要求:
1、 国内外知名大学,统招研究生或重点本科,计算机或相关专业;
2、 三年以上爬虫开发经验,两年以上大规模爬虫系统开发经验优先;
3、 熟悉爬虫原理,掌握常见的反爬虫技术,精通Scrapy框架,熟练使用Splash;
4、 精通WebDriver,掌握http协议,熟悉html、dom、xpath等常见的数据抽取技术;
5、 熟练使用MySQL、MongoDB,熟悉Hadoop、HBase、Elastic Search等技术;
6、 扎实的算法和数据结构能力,有大规模代理服务器管理经验和模板失效应对的经验优先;
7、 具有BAT及TAM等知名公司爬虫开发实操经验者优先。

来源:https://eleduck.com/posts/kRf8gV