公司名稱:某科技公司
工作地點:上海
工作職責:
1.設計并開發實驗評估大模型的擴展性和有效性,研究其在復雜性問題上的泛化性
2.管理大規模數據并創建可視化方法,設計基于LLM的新產品。
任職要求:
1、具備高效機器學習和深度學習的開發經驗,了解AI生成模型框架,包括Transformer decoder、Diffusion等,了解RL和PEFT等。
2、理工科碩士或博士畢業,5年以上產業界經驗,具備扎實的數理基礎和良好的科研素養。
3、有數據流水線的設計和構建經驗,有數據搜集和培育經驗,以及模型性能的評估經驗。
4、有復雜算法的設計、實現、分析和調優能力。
5、有在GPU集群上的訓練和部署經驗。
6、有在大型分布式系統上工作的經驗。
7、熟悉Web開發,Python和數據庫。