职位描述
该职位还未进行加V认证,请仔细了解后再进行投递!
职位描述:
1. 负责研发和维护深度学习框架:负责研发和维护 AI 训练框架(Tensorflow,Pytorch),提供高效、可扩展、易用的编程接口,支持多种硬件平台和操作系统。
2. 负责大规模分布式训练:针对大规模数据和模型的训练需求,需要支持分布式训练,包括参数服务器、分布式优化等技术的设计和实现。
3. 负责训练和推理的性能优化:为了提高框架的性能和可扩展性,需要进行各种性能优化,如GPU加速计算、减少内存占用、降低网络通信开销等。
4. 负责深度学习研究和创新:除了开发框架和工具外,还需要进行深度学习研究和探索,推动 AI 技术的进一步发展
职位要求:
1. 熟练掌握C 和Python语言开发;
2. 熟练掌握Tensorflow/Pytorch进行模型训练和推理,具有一些Tensorflow/Pytorch框架的开发和维护经验,Tensorflow/Pytorch相关开源项目贡献者优先;
3. 具有多GPU并行训练,GPU性能优化的经验