作者 | 王怡宁
编辑 | 邓咏仪
36氪得悉,1月9日,百川智能正式发布角色大模型Baichuan-NPC。Baichuan-NPC优化了“角色知识”和“对话才干”,使模型可以更好的理解上下文对话语义,更加符合人物性格地停止对话和行动,让角色更加真实生动。
百川智能由搜狗开创人王小川于2023年4月创建,36氪此前曾做报道,也在持续关注百川智能研发动态。
除了发布模型以外, 百川智能此次还推出了“角色创建平台+搜索加强知识库”的定制化处置方案。通过这一方案,游戏厂商无需编写任何代码,只需通过简单的文字描绘,便可以快速构建出自己需要的角色,实现低本钱、高效率的角色定制。
处置人设崩坏问题,角色拟人度显著提升
大模型概念自ChatGPT问世以来备受关注,尤其也为游戏等领域带来更多想象空间。OpenAI最早就是利用《DOTA 2》训练AI,通过模仿现实世界的混乱和复杂确立了大模型的开发方向和根底。AI技术也已经被引入游戏行业的NPC定制、绘图、场景建模等应用场景中,协助游戏行业实现降本增效。
但是,当前想要将大模型运用到游戏研发流程中仍面临不少挑战,其中最大的挑战是当下的大模型在角色扮演上“不够拟人”,削弱了用户的沉浸式游戏体验。
模型在角色扮演中是否足够“拟人”,主要由模型的根底才干和角色扮演一致性两个方面来决定。
其中,根底才干既包括模型的通用智能水准,还包含角色知识、对话才干、情节演绎以及逻辑推理四个专项才干。而强化这些才干的最佳方式是在预训练阶段通过高质量数据集停止针对性训练。百川智能搜集了大量行业网站、高质量书籍、优质剧本数据,对Baichuan-NPC停止了超越3T Tokens的领域知识预训练。
此外,Baichuan-NPC还使用多方法模型合成数据停止预训练阶段的领域知识加强,缓解了逆转诅咒(Reversal Curse)问题,大幅度提升Token利用效率。
角色扮演一致性问题指的是,通用语言模型在角色“演绎”过程中,非常容易跳出“角色设定”变回“智能助手”或做出不符合角色人设的言行。针对这一问题,百川智能将思维链对齐技术引入到角色模型对齐中,让模型的考虑过程和考虑之后的行动表现更接近人类,提升了角色一致性,加强模型的根底对话才干和角色演绎才干。
Baichuan-NPC示例
据百川智能,为了验证模型各项才干,Baichuan-NPC参与了CharacterEval(由中国人民大学高瓴人工智能学院、北京邮电大学人工智能学院结合推出的对话类角色扮演Agent评估规范)评测,测试结果显示其在对话才干、角色一致性、扮演吸引力等方面具备优势,位于中文领域角色模型前列。
零代码复刻角色,满足游戏定制需求
当前,行业内的游戏角色构建主要通过API调用实现,存在开发流程门槛高、周期长等问题。对此,百川智能在Baichuan-NPC根底上推出了由“角色创建平台+搜索加强知识库”组成的开发套件。通过规范化模板、自定义选项、所见即得的调优界面及搜索加强知识库,开发套件为用户提供了一个自由度更高且无需编写代码的低本钱处置方案。
百川角色大模型官网
为进步角色定制自由度和真实度,百川智能自研了强多轮对齐和搜索加强知识库两项技术。强多轮对齐技术通过设计System Prompt中的角色设定字段,保证了角色言行响应系统指令定制的敏感性和稳定性。
简单来说,用户在系统提示(System Prompt)中定义了角色特征后,角色就会完全遵循用户设定,停止相应的“演绎”。
不同性格设定下的孙悟空
同时,百川智能将搜索技术与角色知识才干相交融,基于最新研发的SOTA模型BCTE(Baichuan-Text-Embedding),为角色和知识库提供了灵敏的“多对多”关联方式。用户上传角色所需的知识文档并自定义回复方式后,就能降低角色产生幻觉的可能性,丰富了角色“内涵”。
此外,平台还提供了一键复制功能。完成角色彩试后,用户可以在查看代码页面一键复制全部角色代码,然后将角色代码集成到业务场景中。这种“所调即所得”的方式,有效缩减了企业定制角色的时间和人员本钱。
微调界面
目前,百川智能已经与创梦天地、完美世界、爱奇艺等众多泛娱乐行业的头部品牌建立了深度合作关系,共同拓展AIGC创作的应用场景。
欢送交流 |