Research Assistant / Intern (Reinforcement Learning)
Research Assistant / Intern (Reinforcement Learning)
研究助理/实习生(强化学习方向)
岗位职责
1. 多模态医疗大模型复杂推理与强化学习;
2. 多模态大模型(如Qwen-VL 架构)的微调策略与训练优化;
3. 多智能体系统的自我进化与持续学习;
4. 多模态大模型工具调用能力提升;
5. 在团队指导下推进研究,定期汇报进展并共同撰写学术论文与专利。
任职要求
1.计算机/AI/数学等相关专业 硕士或优秀本科毕业生(香港在读硕士可提供实习机会);
2.对AI科研充满热情,具备自主学习能力与解决问题的意愿;
3. 熟练掌握 Python,具备 PyTorch 在大语言模型 (LLM) 全流程实践经验:
- 熟悉分布式训练框架,如 DDP,FSDP,deepspeed 的概念与实现,能够在多 GPU 环境下高效组织训练。
- 精通 Prompt Engineering、Few‑Shot / Zero‑Shot 微调、Instruction‑tuning 等 LLM 调优方法。
- 具备实验设计与结果分析能力:能够制定训练/验证指标(如 perplexity、BLEU 等),使用 WandB 等可视化工具进行实验追踪与调参。
申请方式
请将个人简历发送至hr02@cair-cas.org.hk。邮件主题请注明应聘[岗位名称]-[姓名]-[官网投递]。

