本帖最后由 小荷兰人 于 2025-3-20 11:07 编辑
【阿里】淘宝主搜索算法团队2025春季招募(实习生&校园招聘):大模型重构电商搜索的未来
——加入我们,用LLM/MLLM/RL开创下一代智能搜索产品
为什么选择我们?
淘宝搜索是阿里巴巴亿级用户交易的核心引擎,也是全球电商领域技术创新的风向标。在这里,你将:
- 深度参与大模型与电商搜索的全场景融合:从LLM、多模态大模型(MLLM)到强化学习(RL),探索技术无人区。
- 定义电商搜索的技术范式:推动SKU引擎、超大规模索引、用户意图理解等技术的突破。
- 打造亿级用户产品:你的代码将直接影响数亿消费者的购物体验与千亿级GMV的达成。
核心方向:大模型驱动的电商搜索革命
开创生成式大模型检索技术:结合LLM生成能力优化候选集召回,定义行业新标准。构建百亿级智能索引系统:通过超大规模智能索引,大模型多模态语义匹配技术,个性化多阶段预训练技术等实现毫秒级精准召回。
构建电商专属LLM相关性引擎:负责设计和优化淘宝主搜相关性,包括基于LLM的相关性大模型、突破多模态理解边界,研发图文双模态VLLM模型,实现商品图文信息与用户意图的精准对齐。应用LLM LongCot能力解决电商搜索用户需求转移问题;建立合理的相关性评测方法,进行数据挖掘,迭代数据标注任务,积累电商领域知识数据资产。
研发与LLM相结合的个性化预估模型:将大语言模型的深度语义理解能力融入CTR/CVR预估,突破传统模型天花板。基于全域用户行为建模、多模态特征抽取、无偏学习、整页排序、多目标最优化,实现"千人千面"的个性化预估。
打造电商领域认知大脑:通过LLM的SFT/RLHF技术,让系统像资深导购一样理解用户需求。设计和优化Query理解及商品理解的方法体系,包括任务的定义、建模及其在搜索全链路的应用优化。深入探索LLM/MLLM/知识蒸馏,多任务建模在Query理解、商品理解中的应用。
挑战万亿参数级模型实战:优化电商领域大模型在搜索场景的推理效率,实现搜索响应速度与精度的双突破。设计下一代稀疏化架构:通过MoE、模型蒸馏等技术,让大模型在电商场景跑得更快、更轻、更准。
负责基于强化学习的电商搜索模型,包括但不限于优化Query理解、商品召回和相关性大模型,指导模型偏好方向,设计出更受掌控、更加适配的电商领域大模型;设计混排层面EE机制,探索更受用户欢迎的融合策略及展示策略。
我们寻找这样的你
- 计算机、自动化、数学或统计学等相关专业硕士及以上学历
- 具备扎实的数据结构,算法和编码能力,精通至少一种编程语言,如C++、JAVA、Python等 ▶ ACM/Kaggle竞赛获奖、顶会论文、开源项目贡献等均为加分项
创新特质:
- 熟练掌握机器学习/深度学习算法的基本原理,并能灵活运用
- 具备电商搜索场景的抽象能力,能从海量数据中发现创新机会点
- 有扎实的动手能力,有工业界相关方向的实践经验者,或参加过ACM或数据挖掘/机器学习类竞赛并取得优异名次者优先
- 有强烈的技术热情,有皮实乐观、不畏挫折的心态;具备优秀的分析和解决问题的能力;具备优秀的学习能力和团队合作精神
加入方式
Base:杭州/北京
投递咨询:立即添加招聘师兄微信 czh454022507