工作职责:
1.负责车联网平台海量车辆数据的采集、清洗、转换与加载(ETL)全流程开发;
2.负责轻量级算法、规则引擎类算法开发;
3.在ETL流程中内置数据质量校验规则,参与数据治理工作,保障数据血缘清晰、数据资产可管理;
4.配置和管理ETL任务的调度,使用 DolphinScheduler(海豚)、Airflow、YARN、Flink 等调度框架,监控日常数据流程的运行状态和性能,及时排查并修复故障,保证数据按时、准确产出;
5.优化SQL和任务调度,提升ETL作业性能与资源利用率。
任职资格:
1.计算机科学、软件工程、数学或相关专业本科及以上学历;
2.3年以上大数据ETL开发经验,有大型数据仓库或数据平台项目实践经验;
3.精通SQL、大数据处理引擎和调度工具;
4.熟练掌握 Python 、Java、Scala 中的至少一种,能够用于脚本编写或数据处理;
5.有实时数据流处理(如 Flink, Spark Streaming)开发经验者优先。