banner

客户案例

目标:打造国家级NLP/新媒体实验室

为智能化算法训练提供优质语料资源,进而实现精准检索、关系挖掘、智能化应用等多种服务,实现大数据与人工智能相关技术在媒体行业的融合应用。

中文世界缺少高质量的NLP语料训练任务

对于机器听说读写能力的提升,数据量是极大的瓶颈

问题:NLP自然语言标注主观性强,难度大,需要标注员具有较强的中文语言能力和较好的政治素养;项目前期,标注需求不够清晰,缺乏完善的标注规则体系;文章篇幅长,大标签数量22个,累积标签和选项达70-80个;文章类型多,场景多,包含9大场景,数据形式多,包含文字、图片和视频等。

解决方案:星尘自动考试系统,部署对应需求的考题设置标注门槛对标注员进行筛选,保证标注员的质量;对于不够完善的标注规则体系,项目配置的专属PM(项目经理),即时反馈标注过程遇到的标注问题并提供多个解决方案,推动优化完善标注规则体系;对于复杂的标注场景与需求,星尘系统带有的预标注与自动质检大大地提高了标注的效率与质量。

未来

新闻即数据,数据即新闻

客户:“凭计算之力,求数据洞察,赋万物为媒,迎智能时代。”与AI结合的媒体大脑是未来媒体行业发展的方向。

某国家权威国家通讯社技术主管

"星尘是我们在建设开拓融媒体国家重点实验室道路上的可靠合作伙伴,他们的系统具备高实用性、实践性,在标注层面用算法辅助大幅度提高效率;项目人员的新闻敏感度和政治素养使得他们高质量地完成新闻稿件标注工作。"

了解更多

我们将为您定制专属的服务内容并评估预算

填写需求表格
了解价格