Are you sure you want to delete this task? Once this task is deleted, it cannot be recovered.
Chunxiang Xu 00b75144c2 | 6 months ago | |
---|---|---|
README.md | 6 months ago |
大语言模型作为一股技术变革力量正在快速重塑我们与信息世界的交互方式。随着大语言模型能力的增长,其研发过程中涉及到数据、训练、部署、价值对齐等方面的深层次技术问题逐步凸显出来。在此背景下,我们总结了与大模型相关的技术问题,并希望通过开源协作的方式来推动问题的持续深入研究。
训练数据的“质”与“量”决定了大模型能力的上限,而训练数据中存在种类繁多的数据缺陷,目前尚缺乏有效的数据质量评估手段与标准。针对这一问题,拟从如下方面开展针对大模型训练数据的质量评估与缺陷检测工作:
大模型训练过程涉及数据配比、训练超参数、网络架构等多方面因素,如何从这些因素中选择合适的组合以最大化模型学习速度,对于理解模型训练过程及降低成本具有重要意义。针对这一问题,拟从如下方面开展针对大模型训练过程版本演化的分析工作:
基于人类反馈的模型优化是实现大模型对齐人类价值的有效手段。现阶段,此类方法尚存在高质量的人类反馈数据获取代价高、奖励模型存在过优化或易被攻击等问题。针对这一情况,拟从如下方面开展基于人类反馈的模型优化方法研究工作:
国产软硬件平台由于硬件能力的差距以及软件生态的不足,尚难以十分高效地实现大模型的部署与推理。针对这一问题,拟从如下方面开展基于国产算力的大模型推理优化工作:
随着大模型在软件工程领域的深入应用,各类智能应用开发方法不断被提出来。如何构建支持智能应用开发的工具与环境是提升开发效率的关键。针对这一问题,拟从如下方面开展基于大模型的智能应用开发环境工作:
模型服务运行时监控是实现智能模型运维的重要手段。现有监控方法监控延迟、吞吐等运营指标,对于模型输入、输出以及性能等维度的监控尚缺乏有效手段。针对这一问题,拟开展面向大模型服务性能的运行时监控研究:
以大模型为驱动的应用构建是智能软件开发的新范式,围绕不同应用构建时所需大模型的能力差异以及如何激活各自应用场景中大模型处理能力等技术问题,拟以无人机指控应用和中阿机器翻译应用为例,开放应用构建示例进行开源探索,推动大模型驱动应用的进步和创新。
在无人机指控应用中,拟开源如下工作:
如果您有更多感兴趣的研究方向,希望获取到的开源资源,或者希望开放的研究内容,欢迎联系我们。
可以在本项目下“任务”(Issue)区域留言,或者发邮件给我们:xuchx@pcl.ac.cn
大模型全周期开源问题:Open issues in LLM life circle
other
Dear OpenI User
Thank you for your continuous support to the Openl Qizhi Community AI Collaboration Platform. In order to protect your usage rights and ensure network security, we updated the Openl Qizhi Community AI Collaboration Platform Usage Agreement in January 2024. The updated agreement specifies that users are prohibited from using intranet penetration tools. After you click "Agree and continue", you can continue to use our services. Thank you for your cooperation and understanding.
For more agreement content, please refer to the《Openl Qizhi Community AI Collaboration Platform Usage Agreement》