#5190 update mind page

Merged
chenshihai merged 3 commits from fix-csh into V20240116 3 months ago
  1. +219
    -164
      web_src/vuepages/pages/model/mind/index.vue

+ 219
- 164
web_src/vuepages/pages/model/mind/index.vue View File

@@ -107,7 +107,7 @@
<div class="descr">
<p v-for="(descr, descrIndex) in tabContent[activeTab].descr" :key="descrIndex">{{ descr }}</p>
</div>
<div class="life-stage">
<div class="life-stage" v-if="tabContent[activeTab].stage">
<div class="title">成长生命期阶段版本<span v-if="activeTab == 0">(当前最新版本——进阶版1.5T Tokens)</span></div>
<div class="descr">您提交的申请体验通过审核后,我们将提供中间 checkpoints 供您研究使用;随着训练的推进,我们将提供对应阶段的 checkpoints 。</div>
<div class="stage-c">
@@ -137,16 +137,55 @@
</div>
</div>
<div class="data-distribution" v-if="tabContent[activeTab].chart.length">
<div class="title">训练数据分布</div>
<div v-if="activeTab == 0">
<div class="title">训练数据分布</div>
<div class="descr">
<p>我们统计了40个学科领域的数据,此处只罗列了占比前5的学科领域的数据分布情况。</p>
<p>
40个学科领域包括:文学、经济、法律、教育学、医学、政治、历史、体育、游戏娱乐、影视影评、心理学、休闲旅游、计算机科学、艺术、食品科学、农业科学、电子商务、电子信息科学、管理学、交通运输、能源科学、军事、轻工业、环境科学、安全科学与消防工程、哲学、生物科学、城市规划与建设、地理、材料科学、广告营销、宗教、天文学、气象学、化学科学、物理科学、数学科学、重工业、通信技术、其他。
</p>
</div>
<div class="chart-el-c">
<div class="chart-el" :class="`chart-el-${index}`" v-for="(item, index) in tabContent[activeTab].chart"
:key="index"></div>
</div>
</div>
<div v-if="activeTab == 1">
<div class="title">训练数据分布</div>
<div class="descr">
<p>我们构建了人机协作模式的预训练数据加工线,共计生产了1TB Tokens的高质量预训练数据。预训练数据的中文、英文、代码、多语言数据比例约为 30%:60%:5%:5%,截止目前,新版PengCheng
Mind-7B模型已完成440B Tokens数据的持续学习训练。</p>
<p>
针对中文训练数据,我们完成了40个学科领域的数据划分和分布统计,具体学科领域包括:文学、经济、法律、教育学、医学、政治、历史、体育、游戏娱乐、影视影评、心理学、休闲旅游、计算机科学、艺术、食品科学、农业科学、电子商务、电子信息科学、管理学、交通运输、能源科学、军事、轻工业、环境科学、安全科学与消防工程、哲学、生物科学、城市规划与建设、地理、材料科学、广告营销、宗教、天文学、气象学、化学科学、物理科学、数学科学、重工业、通信技术、其他。
</p>
</div>
<div class="chart-el-c">
<div class="chart-el chart-el-full" :class="`chart-el-0`"></div>
</div>
<div class="descr">
<p>
针对英文训练数据,我们完成了38个学科领域的数据划分和分布统计,具体学科领域包括:Entertainment and tourism、Medicine and health、Business、Language
and literature、History、Arts、Law、Computer Science、Energy science、Mathematics、Political Science、Management
Science、Sociology、Physics、Religious Studies、Education、Military science、Human physical performance and
recreation、Environment studies and forestry、Agriculture、Archaeology、Information and communication
sciences、Engineering and
technology、Philosophy、Astronomy、Geography、Biology、Transportation、Economics、Materials
Science、Chemistry、Psychology、Food science、Communication technology、Earth Science、Aerography、Architecture
and design、Others。
</p>
</div>
<div class="chart-el-c">
<div class="chart-el chart-el-full" :class="`chart-el-1`"></div>
</div>
</div>
</div>
<div class="performance-evaluation" v-if="tabContent[activeTab].evaluation">
<div class="title">性能评测</div>
<div class="descr">
<p>我们统计了40个学科领域的数据,此处只罗列了占比前5的学科领域的数据分布情况。</p>
<p>
40个学科领域包括:文学、经济、法律、教育学、医学、政治、历史、体育、游戏娱乐、影视影评、心理学、休闲旅游、计算机科学、艺术、食品科学、农业科学、电子商务、电子信息科学、管理学、交通运输、能源科学、军事、轻工业、环境科学、安全科学与消防工程、哲学、生物科学、城市规划与建设、地理、材料科学、广告营销、宗教、天文学、气象学、化学科学、物理科学、数学科学、重工业、通信技术、其他。
</p>
<p>{{ tabContent[activeTab].evaluation.descr }}</p>
</div>
<div class="chart-el-c">
<div class="chart-el" :class="`chart-el-${index}`" v-for="(item, index) in tabContent[activeTab].chart"
:key="index"></div>
<div class="chart-el chart-el-full" :class="`chart-el-eval`" style="height:450px;"></div>
</div>
</div>
</div>
@@ -171,9 +210,7 @@
<span class="card-name" :title="technology.name">{{ technology.name }}</span>
</div>
</div>
<!-- <div class="card-descr">{{ technology.descr }}</div> -->
<div v-for="(reserch, index) in technology.researchs" :key="index">
<!-- <div class="card-researchs-title" v-if="reserch.title"> {{ reserch.title }}</div> -->
<ul class="card-researchs">
<li class="card-reserch" v-for="(content, index) in reserch.list" :key="index">
<div class="card-reserch-content">{{ content }}</div>
@@ -217,13 +254,13 @@
import * as echarts from "echarts";
import { getPromoteData } from '~/apis/modules/common';

const templateOptions = {
const templateOptions1 = {
title: {
text: '',
left: 'center',
},
grid: {
top: 48
top: 48,
},
tooltip: {
show: true,
@@ -231,7 +268,7 @@ const templateOptions = {
},
xAxis: {
type: 'category',
axisLabel: {}, // interval: 0, rotate: 30
axisLabel: {},
data: [],
},
yAxis: {
@@ -240,11 +277,6 @@ const templateOptions = {
formatter: '{value}%'
},
},
// dataZoom: [{
// type: 'inside',
// start: 0,
// end: 100
// }],
series: [{
data: [],
type: 'bar',
@@ -255,12 +287,40 @@ const templateOptions = {
label: {
show: true,
position: 'top',
// rotate: 30,
formatter: '{c}%'
}
}]
};

const templateOptions2 = {
title: {
text: '',
top: 0,
left: 'center',
textStyle: {
lineHeight: 22,
},
},
grid: {
top: 68,
bottom: 78,
containLabel: true
},
tooltip: {
trigger: 'axis'
},
xAxis: {
type: 'category',
data: [],
},
yAxis: {
type: 'value',
min: 20,
max: 70,
},
series: []
};

const chartHandlers = [];

export default {
@@ -305,158 +365,95 @@ export default {
],
chart: [{
title: '0-150B Tokens主要数据分布',
x: ['文学', '经济', '其他', '法律', '教育学', '医学', '政治', '历史', '体育', '游戏娱乐', '影视影评', '心理学', '休闲旅游', '计算机科学', '艺术', '食品科学', '农业科学', '电子商务', '电子信息科学', '管理学', '交通运输', '能源科学', '军事', '轻工业', '环境科学', '安全科学与消防工程', '哲学', '生物科学', '城市规划与建设', '地理', '材料科学', '广告营销', '宗教', '天文学', '气象学', '化学科学', '物理科学', '数学科学', '重工业', '通信技术'],
y: [37.04, 11.98, 7.27, 7.03, 4.83, 4.8, 2.83, 2.67, 2.06, 1.89, 1.83, 1.41, 1.24, 1.06, 1.02, 0.98, 0.89, 0.85, 0.77, 0.7, 0.65, 0.64, 0.48, 0.47, 0.46, 0.43, 0.43, 0.41, 0.4, 0.4, 0.37, 0.3, 0.26, 0.24, 0.23, 0.18, 0.17, 0.13, 0.13, 0.07],
x0: ['文学', '经济', '法律', '教育学', '医学'],
y0: [37.04, 11.98, 7.03, 4.83, 4.8],
x: ['文学', '经济', '法律', '教育学', '医学'],
y: [37.04, 11.98, 7.03, 4.83, 4.8],
}, {
title: '150-330B Tokens主要数据分布',
x: ['文学', '其他', '经济', '法律', '医学', '历史', '教育学', '游戏娱乐', '政治', '体育', '影视影评', '休闲旅游', '心理学', '计算机科学', '艺术', '食品科学', '电子信息科学', '农业科学', '电子商务', '管理学', '军事', '交通运输', '轻工业', '能源科学', '环境科学', '材料科学', '安全科学与消防工程', '生物科学', '哲学', '地理', '宗教', '广告营销', '化学科学', '城市规划与建设', '天文学', '气象学', '物理科学', '通信技术', '数学科学', '重工业'],
y: [28.42, 9.98, 9.59, 7.44, 5.53, 4.23, 3.59, 3.18, 2.87, 2.74, 2.26, 1.75, 1.45, 1.35, 1.33, 1.29, 1.23, 1.11, 0.89, 0.84, 0.84, 0.83, 0.69, 0.6, 0.6, 0.56, 0.54, 0.54, 0.53, 0.53, 0.52, 0.36, 0.33, 0.33, 0.26, 0.24, 0.18, 0.16, 0.15, 0.14],
x0: ['文学', '经济', '法律', '医学', '历史'],
y0: [28.42, 9.59, 7.44, 5.53, 4.23],
x: ['文学', '经济', '法律', '医学', '历史'],
y: [28.42, 9.59, 7.44, 5.53, 4.23],
}, {
title: '330-530B Tokens主要数据分布',
x: ['文学', '其他', '经济', '法律', '医学', '教育学', '历史', '政治', '游戏娱乐', '体育', '影视影评', '休闲旅游', '计算机科学', '艺术', '食品科学', '心理学', '电子商务', '农业科学', '电子信息科学', '交通运输', '轻工业', '管理学', '军事', '环境科学', '能源科学', '安全科学与消防工程', '地理', '材料科学', '生物科学', '宗教', '哲学', '广告营销', '城市规划与建设', '化学科学', '气象学', '天文学', '重工业', '物理科学', '数学科学', '通信技术'],
y: [24.94, 10.49, 10.29, 7.73, 5.17, 3.97, 3.73, 3.2, 3.2, 3.09, 2.2, 2.01, 1.72, 1.41, 1.36, 1.34, 1.29, 1.24, 1.21, 0.94, 0.91, 0.89, 0.78, 0.71, 0.69, 0.62, 0.51, 0.5, 0.5, 0.5, 0.46, 0.45, 0.37, 0.31, 0.27, 0.27, 0.2, 0.19, 0.17, 0.17],
x0: ['文学', '经济', '法律', '医学', '教育学'],
y0: [24.94, 10.29, 7.73, 5.17, 3.97],
x: ['文学', '经济', '法律', '医学', '教育学'],
y: [24.94, 10.29, 7.73, 5.17, 3.97],
}]
}, {
descr: [
`PengCheng-Mind 7B 脑海大模型是基于中国算力网训练,可实现跨算力中心迁移的70亿参数自回归式语言模型,该模型支持NPU版本到GPU版本的转换,具有强大的语言理解和生成能力,可深入理解输入文本,自动生成连贯、合理的语句。模型可用于多种自然语言处理任务,如文本生成、机器翻译、问答系统等。PengCheng-Mind 7B在自然语言处理领域具有广阔的应用前景,有利于加速人工智能的学术研究和智能应用的开发过程。`,
],
stage: [
{ name: '第一阶段', tokens: '100B Tokens', },
{ name: '第二阶段', tokens: '200B Tokens', },
{ name: '第三阶段', tokens: '300B Tokens', },
{ name: '第四阶段', tokens: '400B Tokens', },
{ name: '第五阶段', tokens: '500B Tokens', },
],
chart: [{
title: '0-36.5B Tokens主要数据分布',
x: ['文学', '经济', '其他', '法律', '历史', '教育学', '政治', '体育', '医学', '游戏娱乐', '影视影评', '艺术', '农业科学', '休闲旅游', '食品科学', '计算机科学', '电子信息科学', '心理学', '交通运输', '电子商务', '军事', '地理', '管理学', '生物科学', '安全科学与消防工程', '环境科学', '能源科学', '轻工业', '哲学', '城市规划与建设', '宗教', '材料科学', '广告营销', '化学科学', '气象学', '天文学', '数学科学', '通信技术', '物理科学', '重工业'],
y: [15.38, 13.63, 11.81, 6.64, 4.72, 4.67, 4.15, 4.1, 3.86, 3.1, 2.64, 1.96, 1.94, 1.78, 1.73, 1.59, 1.47, 1.42, 1.32, 1.18, 1.13, 1.05, 1.01, 0.79, 0.74, 0.73, 0.65, 0.58, 0.56, 0.53, 0.47, 0.43, 0.39, 0.36, 0.33, 0.3, 0.25, 0.25, 0.23, 0.13],
x0: ['文学', '经济', '法律', '历史', '教育学'],
y0: [15.38, 13.63, 6.64, 4.72, 4.67],
type: 'full',
title: '中文数据分布',
x: ['文学', '经济', '其他', '政治', '教育学', '法律', '医学', '历史', '体育', '影视影评', '心理学', '艺术', '计算机科学', '农业科学', '交通运输', '安全科学与消防工程', '游戏娱乐', '环境科学', '电子信息科学', '管理学', '能源科学', '食品科学', '军事', '哲学', '城市规划与建设', '生物科学', '电子商务', '材料科学', '休闲旅游', '天文学', '数学科学', '气象学', '物理科学', '轻工业', '化学科学', '地理', '宗教', '通信技术', '广告营销', '重工业'],
y: [7.87, 6.3, 6.3, 4.73, 4.73, 4.73, 3.94, 3.94, 3.15, 3.15, 3.15, 3.15, 3.15, 2.95, 2.36, 2.36, 2.36, 2.36, 2.36, 2.36, 2.36, 2.36, 1.58, 1.58, 1.58, 1.58, 1.58, 1.26, 1.18, 1.18, 1.18, 1.18, 1.18, 1.18, 0.79, 0.79, 0.79, 0.47, 0.39, 0.39],
}, {
title: '36.5-123.5B Tokens主要数据分布',
x: ['文学', '其他', '经济', '历史', '医学', '教育学', '法律', '政治', '影视影评', '体育', '游戏娱乐', '心理学', '休闲旅游', '艺术', '食品科学', '农业科学', '计算机科学', '管理学', '交通运输', '军事', '电子信息科学', '地理', '电子商务', '宗教', '哲学', '生物科学', '环境科学', '安全科学与消防工程', '轻工业', '能源科学', '城市规划与建设', '广告营销', '材料科学', '气象学', '天文学', '化学科学', '物理科学', '数学科学', '通信技术', '重工业'],
y: [20.93, 11.48, 11.42, 5.48, 5.02, 4.91, 3.73, 3.12, 3.11, 2.98, 2.78, 2.49, 2.46, 1.96, 1.93, 1.56, 1.24, 1.09, 1.07, 1.06, 1.03, 0.92, 0.86, 0.83, 0.82, 0.61, 0.6, 0.6, 0.58, 0.52, 0.44, 0.42, 0.38, 0.31, 0.29, 0.25, 0.21, 0.19, 0.18, 0.13],
x0: ['文学', '经济', '历史', '医学', '教育学'],
y0: [20.93, 11.42, 5.48, 5.02, 4.91],
}, {
title: '123.5-197.5B Tokens主要数据分布',
x: ['文学', '经济', '其他', '法律', '政治', '医学', '教育学', '体育', '游戏娱乐', '历史', '计算机科学', '休闲旅游', '影视影评', '电子商务', '电子信息科学', '艺术', '食品科学', '轻工业', '农业科学', '心理学', '管理学', '交通运输', '能源科学', '环境科学', '安全科学与消防工程', '广告营销', '军事', '材料科学', '地理', '宗教', '哲学', '生物科学', '城市规划与建设', '重工业', '化学科学', '气象学', '天文学', '通信技术', '物理科学', '数学科学'],
y: [19.42, 11.95, 10.82, 8.62, 5.43, 4.82, 3.79, 3.76, 3.06, 2.92, 2.37, 2.11, 2.09, 1.89, 1.37, 1.34, 1.31, 1.25, 1.07, 1.03, 1, 0.99, 0.89, 0.81, 0.65, 0.59, 0.58, 0.53, 0.49, 0.45, 0.37, 0.37, 0.36, 0.29, 0.28, 0.24, 0.24, 0.19, 0.15, 0.12],
x0: ['文学', '经济', '法律', '政治', '医学'],
y0: [19.42, 11.95, 8.62, 5.43, 4.82],
}, {
title: '197.5-284.5B Tokens主要数据分布',
x: ['文学', '法律', '其他', '经济', '医学', '历史', '政治', '教育学', '游戏娱乐', '体育', '影视影评', '休闲旅游', '计算机科学', '心理学', '电子商务', '艺术', '食品科学', '电子信息科学', '管理学', '轻工业', '农业科学', '交通运输', '能源科学', '环境科学', '哲学', '军事', '安全科学与消防工程', '宗教', '材料科学', '广告营销', '地理', '生物科学', '城市规划与建设', '化学科学', '天文学', '重工业', '气象学', '物理科学', '通信技术', '数学科学'],
y: [29.72, 20.27, 7.48, 7.29, 3.47, 3.44, 3.14, 2.77, 2.61, 2.33, 1.66, 1.43, 1.38, 1.06, 1.02, 1, 0.94, 0.83, 0.78, 0.74, 0.74, 0.57, 0.52, 0.51, 0.5, 0.5, 0.41, 0.39, 0.38, 0.37, 0.29, 0.24, 0.22, 0.19, 0.17, 0.17, 0.16, 0.13, 0.11, 0.09],
x0: ['文学', '法律', '经济', '医学', '历史'],
y0: [29.72, 20.27, 7.29, 3.47, 3.44,],
}, {
title: '284.5-344.5B Tokens主要数据分布',
x: ['文学', '法律', '其他', '经济', '教育学', '政治', '医学', '体育', '游戏娱乐', '历史', '休闲旅游', '计算机科学', '影视影评', '电子商务', '食品科学', '艺术', '轻工业', '心理学', '电子信息科学', '农业科学', '管理学', '环境科学', '交通运输', '能源科学', '安全科学与消防工程', '军事', '广告营销', '宗教', '材料科学', '哲学', '城市规划与建设', '重工业', '地理', '生物科学', '气象学', '天文学', '化学科学', '通信技术', '物理科学', '数学科学'],
y: [18.27, 12.97, 11.54, 10.65, 4.16, 4.12, 4.1, 3.43, 3.17, 2.84, 2.26, 2.2, 2.09, 1.8, 1.39, 1.38, 1.31, 1.15, 1.14, 1.1, 1.02, 0.83, 0.83, 0.77, 0.65, 0.61, 0.58, 0.54, 0.49, 0.37, 0.33, 0.3, 0.3, 0.25, 0.25, 0.21, 0.2, 0.17, 0.12, 0.1],
x0: ['文学', '法律', '经济', '教育学', '政治'],
y0: [18.27, 12.97, 10.65, 4.16, 4.12],
}]
type: 'full',
title: '英文数据分布',
x: ['Entertainment and tourism', 'Medicine and health', 'Business', 'Language and literature', 'History', 'Arts', 'Law', 'Computer Science', 'Energy science', 'Mathematics', 'Political Science', 'Management Science', 'Sociology', 'Physics', 'Religious Studies', 'Education', 'Military science', 'Human physical performance and recreation', 'Environment studies and forestry', 'Agriculture', 'Archaeology', 'Information and communication sciences', 'Engineering and technology', 'Philosophy', 'Astronomy', 'Geography', 'Biology', 'Transportation', 'Economics', 'Materials Science', 'Chemistry', 'Psychology', 'Food science', 'Communication technology', 'Earth Science', 'Aerography', 'Architecture and design'],
y: [9.75, 4.86, 4.73, 4.66, 4.65, 4.16, 4.13, 4.02, 3.96, 3.73, 3.69, 3.38, 3.23, 2.89, 2.82, 1.98, 1.75, 1.59, 1.51, 1.39, 1.32, 1.27, 1.25, 1.16, 1.13, 1.12, 1.11, 0.87, 0.87, 0.85, 0.84, 0.84, 0.73, 0.69, 0.65, 0.48, 0.43],
}],
evaluation: {
descr: '预训练模型PengCheng Mind-7B:学科、语言、知识、理解、推理能力持续提升,模型440B节点Checkpoint的学科综合任务(C-EVAL)得分47.3,知识问答任务(Webqa)得分64.3,蕴含推理任务上(CMNLI)得分49.75,科学文献理解(C3-m)得分65.39,指代消解语言任务(winogrande)得分65.19。',
chartTitle: 'PengCheng-Mind 7B\nCheckpoints(in billions of tokens)',
category: ['40B', '100B', '170B', '220B', '320B', '440B'],
data: [{
name: 'WebQA-知识',
label: { show: true, },
data: [
{ value: 32.2, label: { position: 'left' } },
{ value: 44.53, label: { position: 'top' } },
{ value: 49.51, label: { position: 'top' } },
{ value: 50.91, label: { position: 'top' } },
{ value: 61.45, label: { position: 'bottom' } },
{ value: 64.3, label: { position: 'bottom' } }
]
}, {
name: 'C-EVAL-学科',
label: { show: true, },
data: [
{ value: 27.5, label: { position: 'bottom' } },
{ value: 35.2, label: { position: 'bottom' } },
{ value: 39.5, label: { position: 'bottom' } },
{ value: 42, label: { position: 'bottom' } },
{ value: 44.3, label: { position: 'bottom' } },
{ value: 47.3, label: { position: 'bottom' } }
]
}, {
name: 'CMNLI-推理',
label: { show: true, },
data: [
{ value: 37.91, label: { position: 'top' } },
{ value: 42.56, label: { position: 'bottom' } },
{ value: 47.34, label: { position: 'bottom' } },
{ value: 49.71, label: { position: 'bottom' } },
{ value: 52.34, label: { position: 'bottom' } },
{ value: 49.75, label: { position: 'top' } }
]
}, {
name: 'c3-m-理解',
label: { show: true, },
data: [
{ value: 53.15, label: { position: 'bottom' } },
{ value: 58.41, label: { position: 'bottom' } },
{ value: 61.28, label: { position: 'top' } },
{ value: 61.47, label: { position: 'bottom' } },
{ value: 62.23, label: { position: 'left' } },
{ value: 65.39, label: { position: 'top' } }
]
}, {
name: 'winogrande-语言',
label: { show: true, },
data: [
{ value: 56.82, label: { position: 'top' } },
{ value: 59.82, label: { position: 'top' } },
{ value: 61.24, label: { position: 'bottom' } },
{ value: 62.98, label: { position: 'top' } },
{ value: 63.93, label: { position: 'top' } },
{ value: 65.19, label: { position: 'right' } }
]
}]
}
}],
researchPlan: null,
/*
researchPlan: {
title: '大模型技术问题开源计划',
descr: '大语言模型作为一股技术变革力量正在快速重塑我们与信息世界的交互方式。随着大语言模型能力的增长,其研发过程中涉及到数据、训练、部署、价值对齐等方面的深层次技术问题逐步凸显出来。在此背景下,我们总结了与大模型相关的7个技术问题,并希望通过开源协作的方式来推动问题的持续深入研究。',
imgSrc: 'https://openi.pcl.ac.cn/OpenIOSSG/promote/raw/branch/master/home/banners/imgs/PC-Mind-open-source-plan.png',
technologys: [{
name: '数据质量评估与缺陷检测',
descr: '训练数据的“质”与“量”决定了大模型能力的上限,而训练数据中存在种类繁多的数据缺陷,目前尚缺乏有效的数据质量评估手段与标准。针对这一问题,拟从如下方面开展针对大模型训练数据的质量评估与缺陷检测工作:',
researchs: [{
title: '',
list: [
'细粒度数据画像',
'通用数据缺陷分析与修复',
'大模型训练数据质量评估指标',
'基于人机交互的数据质量优化',
],
}],
link: 'https://openi.pcl.ac.cn/LLM-Research/DataQuality',
}, {
name: '大模型训练过程版本演化分析',
descr: '大模型训练过程涉及数据配比、训练超参数、网络架构等多方面因素,如何从这些因素中选择合适的组合以最大化模型学习速度,对于理解模型训练过程及降低成本具有重要意义。针对这一问题,拟从如下方面开展针对大模型训练过程版本演化的分析工作:',
researchs: [{
title: '',
list: [
'大模型表征空间对模型性能影响分析',
'模型学习速度优化',
'模型训练充分性评估',
],
}],
link: 'https://openi.pcl.ac.cn/LLM-Research/ModelEvolution',
}, {
name: '基于人类反馈的模型优化',
descr: '基于人类反馈的模型优化是实现大模型对齐人类价值的有效手段。现阶段,此类方法尚存在高质量的人类反馈数据获取代价高、奖励模型存在过优化或易被攻击等问题。针对这一情况,拟从如下方面开展基于人类反馈的模型优化方法研究工作:',
researchs: [{
title: '',
list: [
'面向人类价值对齐的大模型调优技术',
'奖励模型不确定性评估',
'基于过程监督的人类反馈信号微调方法'
],
}],
link: 'https://openi.pcl.ac.cn/LLM-Research/RLHF',
}, {
name: '基于国产算力的大模型推理优化',
descr: '国产软硬件平台由于硬件能力的差距以及软件生态的不足,尚难以十分高效地实现大模型的部署与推理。针对这一问题,拟从如下方面开展基于国产算力的大模型推理优化工作:',
researchs: [{
title: '',
list: [
'基于国产硬件的并行分布推理加速技术',
'基于国产硬件的软硬件协同优化技术',
'基于剪枝、量化、蒸馏的轻量化技术'
],
}],
link: 'https://openi.pcl.ac.cn/LLM-Research/InferenceOptimise',
}, {
name: '基于大模型的智能应用开发',
descr: '随着大模型在软件工程领域的深入应用,各类智能应用开发方法不断被提出来。如何构建支持智能应用开发的工具与环境是提升开发效率的关键。针对这一问题,拟从如下方面开展基于大模型的智能应用开发环境工作:',
researchs: [{
title: '',
list: [
'面向大模型的智能应用开发框架',
'基于智能软件资源库的应用开发环境',
'大模型辅助的智能软件应用开发方法'
],
}],
link: 'https://openi.pcl.ac.cn/LLM-Research/app-dev-tools',
}, {
name: '大模型服务性能运行监控',
descr: '模型服务运行时监控是实现智能模型运维的重要手段。现有监控方法监控延迟、吞吐等运营指标,对于模型输入、输出以及性能等维度的监控尚缺乏有效手段。针对这一问题,拟开展面向大模型服务性能的运行时监控研究:',
researchs: [{
title: '',
list: [
'无监督提示词质量评估方法',
'输出质量评估与监控方法',
'模型性能漂移监控方法'
],
}],
link: 'https://openi.pcl.ac.cn/LLM-Research/OnlineLLMMonitor',
}, {
name: '基于大模型的应用构建',
descr: '以大模型为驱动的应用构建是智能软件开发的新范式,围绕不同应用构建时所需大模型的能力差异以及如何激活各自应用场景中大模型处理能力等技术问题,拟以无人机指控应用和中阿机器翻译应用为例,开放应用构建示例进行开源探索,推动大模型驱动应用的进步和创新。',
researchs: [{
title: '',
list: [
'无人机指令控制应用',
'机器翻译应用',
],
}],
link: 'https://openi.pcl.ac.cn/LLM-Research/Applications',
}]
},*/
};
},
components: {},
@@ -485,13 +482,57 @@ export default {
const charts = this.tabContent[this.activeTab].chart || [];
for (let i = 0, iLen = charts.length; i < iLen; i++) {
const chart = charts[i];
const options = JSON.parse(JSON.stringify(templateOptions));
const options = JSON.parse(JSON.stringify(templateOptions1));
options.title.text = chart.title;
// options.xAxis.data = chart.x.slice(0);
// options.series[0].data = chart.y.slice(0);
options.xAxis.data = chart.x0.slice(0);
options.series[0].data = chart.y0.slice(0);
const chartHandler = echarts.init(document.querySelector(`.chart-el-${i}`));
options.xAxis.data = chart.x.slice(0);
options.series[0].data = chart.y.slice(0);
const chartEl = document.querySelector(`.chart-el-${i}`);
if (chart.type == 'full') {
const clientWidth = chartEl.clientWidth;
options.grid.containLabel = true;
options.grid.bottom = 5;
options.xAxis.axisLabel = {
interval: 'auto',
rotate: 45,
width: 100,
overflow: 'truncate',
ellipsis: '...',
};
options.dataZoom = [{
type: 'inside',
start: 0,
end: 100
}];
options.series[0].label.rotate = 30;
options.series[0].barWidth = 'auto';
options.series[0].barMaxWidth = 20;
if (clientWidth < 1000) {
options.series[0].label.show = false;
}
}
if (chartEl) {
const chartHandler = echarts.init(chartEl);
chartHandler.setOption(options);
chartHandlers.push(chartHandler);
}
}
const evaluation = this.tabContent[this.activeTab].evaluation;
const evaluationEl = document.querySelector(`.chart-el-eval`);
if (evaluation && evaluationEl) {
const options = JSON.parse(JSON.stringify(templateOptions2));
options.title.text = evaluation.chartTitle;
options.xAxis.data = evaluation.category.slice(0);
options.legend = {
top: 380,
data: evaluation.data.map(item => item.name),
};
options.series = evaluation.data.map(item => {
return {
type: 'line',
...item,
}
})
const chartHandler = echarts.init(evaluationEl);
chartHandler.setOption(options);
chartHandlers.push(chartHandler);
}
@@ -822,6 +863,7 @@ export default {
}

.data-distribution,
.performance-evaluation,
.life-stage {
.title {
font-weight: 700;
@@ -892,6 +934,11 @@ export default {
height: 400px;
margin-bottom: 40px;
}

.chart-el-full {
height: 450px;
flex-basis: calc(100%);
}
}
}

@@ -1102,6 +1149,10 @@ export default {
.chart-el {
flex-basis: calc(33.3%);
}

.chart-el-full {
flex-basis: calc(100%);
}
}
}

@@ -1110,6 +1161,10 @@ export default {
.chart-el {
flex-basis: calc(49%);
}

.chart-el-full {
flex-basis: calc(100%);
}
}
}



Loading…
Cancel
Save