中文语料
-
大模型发展加速,中文语料够用吗?
“大模型训练数据标注人员的学历要求比以前更高,很多是本科毕业。”王峥表示,行业大模型数据标注凸显了专业知识的重要性。标注人员由学校四五十名大学英语教师组成,且均为应用语言学专业的硕博士。只有最终实现了规模化高质量标注,才能切实提升大模型理解中文、传递中国传统文化价值的能力。...
“大模型训练数据标注人员的学历要求比以前更高,很多是本科毕业。”王峥表示,行业大模型数据标注凸显了专业知识的重要性。标注人员由学校四五十名大学英语教师组成,且均为应用语言学专业的硕博士。只有最终实现了规模化高质量标注,才能切实提升大模型理解中文、传递中国传统文化价值的能力。...