好未来集团

利用AI技术驱动教育变革,携手全球高水准人工智能科学家及教育领域顶尖人才,专注在计算机视觉、智能语音、自然语言处理和数据挖掘等前沿技术在教育行业的应用及创新

中国北京
Selected Projects

该算法提出一个端到端的神经网络模型,可以利用常识知识图谱和方程表达式生成丰富的数学应用题(MWP)。所提出的模型(1)从符号方程表达式和常识知识的 Levi 图中学习表征;(2)在生成MWP 时,通过自我规划模块自动融合方程式和常识知识信息。在教育场景数据集的实验表明,和其它模型相比,该方法在 MWP 生成任务上有明显优势,在自动评价指标和人类评价指标方面都优于 SOTA 模型。在教育数据集中,方程相关性分数达到 2.308,主题相关性分数达到 2.558,语言连贯性分数达到 2.505。

4     1     0

该算法提出一个基于众包标签的监督表示学习 (SRL) 统一框架 NeuCrowd。可以缓解由于数据隐私、预算限制、特定领域标注人员短缺等导致的众包标签的数量有限的问题。该框架 (1) 通过safety-aware 抽样和稳健的锚点生成,创建了大量高质量 n 元组训练样本;(2)学习一个抽样神经网络,自适应地为 SRL 网络选择有效样本。在酒店评论数据集上,accuracy 达到 87.1%;在 Pre-K Children Speech 数据集上accuracy 达到 86.7%。

4     0     0

哮天犬是一个通用的统一告警平台,提供配置化、流程化、标准化的能力,支持多种告警通知渠道,支持告警收敛、过滤、升级、工作流、自动恢复等功能,实现统一输入、不同输出。可以对接Grafana、阿里云Arms、实时计算等监控能力,各业务也可以直接在代码中埋点上报告警,也可以定制化开发,实现监控告警全场景覆盖。

4     0     0
RLL

该算法提出了一种新的基于众包标签的表示学习框架,“RLL”。该算法通过联合和一致性来解决有限和不一致标签所带来的挑战,从而学习数据表征。该框架在两个真实教育应用中进行验证,实验结果证明该方法可以从有限的标注数据中学习到更好的表示。在 Oral Math Questions 数据集中该算法 accuracy 达到88.8%, F1 达到 91.5%。在 Online 1v1 Class Qualities数据集中该算法 accuracy 达到87.9%, F1 达到 92%。

4     0     0

该算法提出一种新的机器学习方法,可以解决发音评估中主观性和耗时性的问题。该算法利用 pair 比较和多模态正交融合算法来产生客观评价结果。在真实的教育场景中,该算法对流利度识别的 accuracy 达到 87.2%,F1 达到 86.2%. 对消极情绪识别的 accuracy 达到 84.6%,F1 达到 80.5%。

4     0     0
CME

该算法提出一种新的多模态深度学习方法,可以识别现实生活说话中的细粒度情感。该算法包含了时间对齐的均值-最大值集合机制,以捕捉每个语篇中隐含的细节和细粒度的情绪。此外该算法还包含一个跨模态激活模块,可以实现对跨模态嵌入进行特定的调整,并通过它来对其他模态的潜在特征相对应的值进行校准。在 IEMOCAP 数据集上该算法WA 达到 72.7%,在 RAVDESS 数据集上 WA 达到 72%。

4     0     0

Repositories

MaKE
Text

该算法提出一个端到端的神经网络模型,可以利用常识知识图谱和方程表达式生成丰富的数学应用题(MWP)。所提出的模型(1)从符号方程表达式和常识知识的 Levi 图中学习表征;(2)在生成MWP 时,通过自我规划模块自动融合方程式和常识知识信息。在教育场景数据集的实验表明,和其它模型相比,该方法在 MWP 生成任务上有明显优势,在自动评价指标和人类评价指标方面都优于 SOTA 模型。在教育数据集中,方程相关性分数达到 2.308,主题相关性分数达到 2.558,语言连贯性分数达到 2.505。

Updated 1 month ago

该算法提出一个基于众包标签的监督表示学习 (SRL) 统一框架 NeuCrowd。可以缓解由于数据隐私、预算限制、特定领域标注人员短缺等导致的众包标签的数量有限的问题。该框架 (1) 通过safety-aware 抽样和稳健的锚点生成,创建了大量高质量 n 元组训练样本;(2)学习一个抽样神经网络,自适应地为 SRL 网络选择有效样本。在酒店评论数据集上,accuracy 达到 87.1%;在 Pre-K Children Speech 数据集上accuracy 达到 86.7%。

Updated 1 month ago

哮天犬是一个通用的统一告警平台,提供配置化、流程化、标准化的能力,支持多种告警通知渠道,支持告警收敛、过滤、升级、工作流、自动恢复等功能,实现统一输入、不同输出。可以对接Grafana、阿里云Arms、实时计算等监控能力,各业务也可以直接在代码中埋点上报告警,也可以定制化开发,实现监控告警全场景覆盖。

Updated 1 month ago

RLL
Python

该算法提出了一种新的基于众包标签的表示学习框架,“RLL”。该算法通过联合和一致性来解决有限和不一致标签所带来的挑战,从而学习数据表征。该框架在两个真实教育应用中进行验证,实验结果证明该方法可以从有限的标注数据中学习到更好的表示。在 Oral Math Questions 数据集中该算法 accuracy 达到88.8%, F1 达到 91.5%。在 Online 1v1 Class Qualities数据集中该算法 accuracy 达到87.9%, F1 达到 92%。

Updated 1 month ago

HIRE
Text

该算法提出了一个新的推荐系统框架用来解决异质性辅助信息进行推荐的问题,这些信息可以帮助理解用户和推荐的内容。该框架通过数学上的一致性来联合建模平面和层次的辅助信息。在3个真实场景数据集的实验结果证明了该框架的有效性。

Updated 1 month ago

该算法提出了一个新的框架,旨在从包含众包标签的有限数据中学习更有效的表征。该框架设计了一个基于分组的深度神经网络来从有限的训练样本中学习向量表示,并提出了一个贝叶斯一致性估计器来识别众包标签之间的不一致性。此外,该框架还包含一个难例选择器,可以自动挑选出被模型错误分类的样本,极大加速训练过程。在教育场景学生发音流利度识别任务中,该算法 accuracy 达到88.7%, F1 达到 91.7%。

Updated 1 month ago

该算法提出一种新的机器学习方法,可以解决发音评估中主观性和耗时性的问题。该算法利用 pair 比较和多模态正交融合算法来产生客观评价结果。在真实的教育场景中,该算法对流利度识别的 accuracy 达到 87.2%,F1 达到 86.2%. 对消极情绪识别的 accuracy 达到 84.6%,F1 达到 80.5%。

Updated 1 month ago

该算法提出了一个新颖的、鲁棒的训练框架,可以提升模型在基于 OCR 识别文本的下游任务表现。该框架:1)采用简单而有效的方法,从干净的文本中直接模拟自然的 OCR 噪音,2)从大量的模拟样本中反复挖掘难样本,以获得最佳性能。3)采用稳定性损失,使模型学习到不受噪音表征的影响。在 Metaphor 数据集上 accuracy 达到 87.7%,F1 达到 87.1%。

Updated 1 month ago

CTAL
Text

该算法提出一个新的基于音频和文本的跨模态预训练模型, CTAL。通过大量的音频和文本对的两个代理任务来学习音频和文本之间的模态内和模态间的联系:屏蔽的语言建模和屏蔽的跨模态声学建模。在对多个下游音频和文本任务进行微调后,CTAL 模型在不同任务上有明显的改进,包括情感分类、情绪分析和说话人验证。其中在 IEMOCAP(Emotion Classification) 数据集上WA 达到73.95%,在MOSEI(Sentiment Analysis)上 F1 达到 81.01%。

Updated 1 month ago

CME
Python

该算法提出一种新的多模态深度学习方法,可以识别现实生活说话中的细粒度情感。该算法包含了时间对齐的均值-最大值集合机制,以捕捉每个语篇中隐含的细节和细粒度的情绪。此外该算法还包含一个跨模态激活模块,可以实现对跨模态嵌入进行特定的调整,并通过它来对其他模态的潜在特征相对应的值进行校准。在 IEMOCAP 数据集上该算法WA 达到 72.7%,在 RAVDESS 数据集上 WA 达到 72%。

Updated 1 month ago

TAL-EduBERT 是教育领域首个在线教学中文预训练模型。模型使用了超过2000万条(约包含3.8亿Tokens)的教育领域中文ASR文本数据进行训练 ,在多个教育领域的下游任务中得到了显著的效果提升。

Updated 1 month ago

Fend
PHP

Fend 是一款短小精悍,可在 FPM/Swoole 服务容器平滑切换的高性能PHP框架

Updated 1 month ago

conan
Java

柯南平台(conan)是一个流量回放全流程解决方案。核心功能包括流量采集、流量回放、结果校验。

Updated 1 month ago

People