北京市,上海市,深圳市AIDU项目技术若干2024-07-09
-AI芯片接入PaddlePaddle、Pytorch、Tensorflow等深度学习框架和性能优化工作
-负责主流AI模型对昆仑AI芯片的适配和性能优化工作
-探索昆仑AI芯片分布式训练方案,解决芯片互联、通讯库等关键问题
-探索新一代昆仑AI芯片编程模型、硬件Spec等关键问题
上海-深度学习高性能计算研发工程师(J73051)
上海市校招技术5人2025-04-27
-负责昆仑AI芯片性能深度学习高性能计算库开发
2025AIDU-芯片前端设计方向(J73297)
北京市,上海市,深圳市AIDU项目技术若干2024-07-09
-参与设计及实现昆仑芯下一代通用微处理器架构
-参与处理器前端、后端、访存部件的微架构设计和硬件实现
-前端取指部件、分支预测部件、乱序执行部件、访存部件(LSU)等模块的设计优化工作
-基于simulator和emulator平台,通过benchmark分析架构瓶颈,提出性能优化方案
-同验证、实现团队紧密合作,保证设计交付质量,持续优化PPA
2025AIDU-大模型基础设施方向(J73293)
北京市AIDU项目技术若干2024-07-09
-参与万卡GPU集群的建设与核心技术的研发工作
-设计并实现自适应的分布式系统框架,算子与通信极致优化,并行策略自动切分,提升大模型训练和推理效率
-探索多芯混合集群高效的训练策略,让任意集群的算力效率都充分发挥出来
-探索算法与算力(芯片设计、集群设计)协同优化的方案,跨数量级降低大模型训练和推理的成本
北京市校招技术5人2025-02-21
包含但不限于以下方向:
-智能网卡:自研数据中心架构级DPU芯片/板卡,实现网络、存储和虚拟化的卸载,更好地支持云计算,AI,边缘计算等未来主流场景。
-虚拟化技术:负责Linux内核、虚拟化方面的研发工作,包括网络虚拟化、存储虚拟化以及轻量级Hypervisor方案的设计和开发。
-存储部件:负责新型存储部件(SSD、Optane DCPMM、Optane SSD等)在业务的应用及推广,也包括通过自研ZNS-SSD,为业务提供定制化的解决方案。
-存储引擎:通过对存储硬件和软件的垂直集成和优化,实现软硬件一体化的高性能、低成本单机存储引擎,支持文件、KV、块存储等多业务场景。
-异构加速:应用硬件加速技术(QAT、FPGA、ISA-L等)在存储系统的性能和成本方面取得优势,应用场景包含硬件压缩、硬件EC、图片和视频的硬件编解码等。