数据产品经理(J84890)
MEG
MEG北京市产品1人2025-05-22
工作职责:
1、主导数据产品规划,构建支持大模型训练的高质量数据体系,包括数据采集、清洗、标注、特征工程等全链路方案设计,确保数据与业务目标对齐。 2、深入理解大模型(如NLP/CV多模态)技术原理,设计数据驱动的模型优化策略,提升训练效率及效果。 3、协同算法团队,制定数据标注标准、评估指标及迭代策略,解决数据偏差、长尾分布等问题,设计数据增强、合成及自动化标注方案,优化大规模预训练与微调数据的供给效率。 4、联动业务、算法、工程团队,推动数据闭环落地,支撑推荐、搜索、AIGC等场景的模型迭代,提炼数据产品通用化能力。
职责要求:
1、硕士及以上学历,计算机、统计学、人工智能相关专业,3年以上数据产品经验,大厂数据挖掘/数据科学背景(如BAT/TMD等)优先。 2、精通Hadoop/Spark/Flink等大数据技术栈,熟悉CNN/Transformer等模型的数据需求,主导过亿级规模数据项目。 3、具备LLM(如GPT、LLaMA)或CV多模态模型数据支持经验,熟悉RLHF、DPO等对齐方法的数据设计。 4、掌握数据蒸馏、去噪、评估等关键环节,能通过数据策略显著提升模型表现。 5、熟练运用SQL/Python进行数据分析,可独立完成数据探查、AB实验及效果归因。