
Chat-GPT问世以来,使得大模型一时间内火爆非凡。国内外各大科技公司也纷纷加入到大模型的研发行列中来,“百模之战”愈演愈烈,国内百度、阿里、华为等科技大厂陆续推出旗下大模型产品,新锐科技公司也不甘落后,目前不少产品已经进入内测阶段。本文就来对国内部分AI大模型产品做个简单的集锦综述。
1.百度——文心一言
文心一言(英文名:ERNIE Bot)是百度全新一代知识增强大语言模型,文心大模型家族的新成员,能够进行对话互动、文本翻译、问题回答,高效便捷地帮助人们获取知识信息。文心一言是知识增强的大语言模型,基于飞桨深度学习平台和文心知识增强大模型,持续从海量数据和大规模知识中融合学习具备知识增强、检索增强和对话增强的技术特色 。
文心一言不仅能够生成文字,还能够生成图片、音频、视频等多种形式的内容 。以百度自研的跨模态大模型ERNIE-ViLG为底层架构,进而能够实现从文字到图像、从图像到文字、从声音到图像等多种转换 。用户通过简单的文字描述,文心一言便可通过相应的指令来图画、LOGO或者视频的产出,具有多模态生成能力。
2.阿里——通义千问
通义千问,是阿里云推出的一个超大规模的语言模型,可以进行多轮对话、文案创作、还具备逻辑推理、多模态理解、多语言支持的能力。通义千问以阿里巴巴达摩院自主研发的大规模分布式计算平台为架构,包括含光800、云计算平台等。在硬件设备方面,使用的是阿里自主研发的高性能计算芯片“含光800”。
通义千问能够跟人类进行多轮的交互,也融入了多模态的知识理解,且有文案创作能力,能够续写小说,编写邮件等。除了基本的文本生成和问答能力,还支持更多的定制化需求,可以针对不同场景和应用进行扩展和定制,提供更加个性化的服务和解决方案。
3.华为——盘古
盘古大模型是华为旗下开发的一系列AI大模型,首次基于「鹏城云脑 Ⅱ」和全场景 AI 计算框架 MindSpore 的自动混合并行模式实现在 2048卡算力集群上的大规模分布式训练,是国产全栈式 AI 基础设施第一次支持 2000 亿级超大规模语言模型训练,探索并验证了国产 E 级智算平台在软硬件协同优化、大规模分布式并行训练等核心关键技术上的可行性。
在模型性能方面,鹏程. 盘古大模型性能全球领先,16 个下游任务中性能指标优于业界 SOTA 模型,其中零样本学习任务 11 个任务领先、单样本学习任务 12 个任务领先、小样本学习任务 13 个任务领先。目前对于网传的“盘古Chat”并没有官方准确消息,但据悉2023华为开发者大会(HDC)将于7月7日在东莞召开,AI将会是本次大会的主线。
4.科大讯飞——星火认知大模型
讯飞星火认知大模型是由讯飞人工智能实验室于2021年9月发布的中文自然语言处理全栈平台,它是基于Transformer架构的深度神经网络模型,拥有超过1000亿个参数,是目前世界上最大的中文预训练语言模型。讯飞星火认知大模型使用了超过1000亿字的中文文本数据进行训练,具有7大核心能力,即文本生成、语言理解、知识问答、逻辑推理、数学能力、代码能力、多模态能力,能够有效地捕捉中文语言的复杂性和多样性。
5.实在智能——TARS
实在的国产大模型,TARS(塔斯)历经半年研发,近期正式上线开始内测。这是国内人工智能企业、RPA赛道头部实在智能自研垂直领域的大语言模型,在TARS大模型中叠加了多项自然语言处理前沿技术,基于开源基座模型,在千亿级高质量Tokens上进行了充分训练,完整复现了Pretrain、SFT和RLHF三个阶段,语言理解能力及指令跟随能力等在横向对比测试中均取得良好效果。
TARS大模型全面支持私有化部署,用户可完全自主掌控数据和模型,确保内部敏感数据的安全性,并可根据业务需求进行定制化开发。响应国家互联网信息办公室发布的“关于《生成式人工智能服务管理办法(征求意见稿)》”,在TARS大模型中叠加了多项自然语言处理前沿技术。如:模型的不当言论判别,从而进一步增强了模型的生成效果和安全性。目前,实在TARS大模型正在进行更全面、更完整的效果评测,相关结果将在近期陆续公布。
6.复旦大学——MOSS
MOSS是复旦大学自然语言处理实验室发布的国内第一个对话式大型语言模型,拥有160亿参数。它由约7000亿中英文及代码单词预训练得到,精度要求不那么高的话,甚至可以在单张3090显卡上运行。MOSS支持中英双语,拥有多轮对话和使用多种插件双重能力,具备搜索引擎、文字生成图片、计算器、方程求解的“技能点”。
作为“国内首个开放测试的ChatGPT”,MOSS已经经历了两版迭代,一版是公开邀请内测的MOSS 002版本,另一版是内部测试版本OpenChat 001。
7.智源研究院——悟道3.0
智源研究院在2023北京智源大会上发布了悟道3.0大模型系列,包括首个支持中英双语知识、开源商用许可协议、支持国内数据合规要求的开源语言大模型悟道·天鹰(Aquila),以及一站式的科学、公正、开放的基础模型评测体系天秤(FlagEval)。它包括7B、33B的基础模型,以及AquilaChat对话模型和AquilaCode文本代码生成模型。
8.360——360智脑
360智脑是360公司开发的一款生成式人工智能大模型产品,集合了 360CV 大模型、360GPT 大模型、360GLM 大模型和 360 多模态大模型的技术能力,具有语言理解、图像识别、自然语言处理等多面应用能力。
9.澜舟科技——“孟子”
孟子预训练模型是基于团队自研技术研发的大规模预训练语言模型。可处理多语言、多模态数据,同时支持多种文本理解和文本生成任务,能快速满足不同领域、不同应用场景的需求。孟子模型基于 Transformer 架构,包含十亿参数量,基于数百 G 级别涵盖互联网网页、社区、新闻、电子商务、金融等领域的高质量语料训练。
10.中科院自动化所——紫东太初
紫东太初,是中国科学院自动化研究所研发的跨模态通用人工智能平台 。全球首个图文音(视觉-文本-语音)三模态预训练模型(OPT-Omni-Perception pre-Trainer),同时具备跨模态理解与跨模态生成能力,取得了预训练模型突破性进展。紫东太初大模型将文本 + 视觉 + 语音各个模态高效协同,实现超强性能,在图文跨模态理解与生成性能上都能领先目前业界的SOTA模型,高效完成跨模态检测、视觉问答、语义描述等下游任务。
目前,技术不断发展推陈出新,国内大模型还在不断涌现,无论是已有模型的优化升级还是新模型的横空出世都值得我们拭目以待,也期待大模型能为各行各业的发展助力赋能,提高各行各业数据处理和决策效率、增强风险预测和控制能力,使数字化时代更上一层楼。
实在智能(Intelligence Indeed)自研垂直领域大语言模型——TARS(塔斯)历经半年研发后,正式上线,开启内测!提高工作效率不是难题!

ChatGPT强势出圈后,AI领域的平静湖面恰似投入巨石,瞬间掀起激动人心的波澜,一场由人工智能引发的产业革命正在发生,并用超快的进化速度带领全人类走进AGI时代。
作为构建AGI的基础之一,大语言模型的出现,使得自然语言处理(NLP)的实现模式发生巨大的变化,引发全社会广泛关注和积极推广。
AI百舸争流,各家“模”路相逢。越来越多的国内企业和科研机构开始投入到大语言模型的研发和应用。清华大学、复旦大学等高校以及阿里巴巴、腾讯、百度、华为等大型企业纷纷入局,快速推动人工智能技术的商用化进程。
同时,一些新锐科技公司在大语言模型的研发和应用当中也在积极探索和发展,并取得了瞩目的成绩。
近期,国内AI准独角兽企业实在智能(Intelligence Indeed)的自研垂直领域大语言模型——TARS(塔斯)历经半年研发后,正式开启内测!
TARS(塔斯)大模型的内测和系统性评测还在进行中,让我们先睹为快看看一些它能做什么:
实在大模型TARS(塔斯)的取名灵感来源于影视科幻巨作《星际穿越》中的机器人角色TARS。
影片中的TARS以其聪明、可靠和机智的特质深受观众喜爱。同时,“塔斯”的中文音译与“踏实”的发音非常相似,这不仅与实在智能的名字遥相呼应,还契合了实在智能团队对创业初心的坚守:
作为一家致力于将AI与RPA等自动化技术融合创新,打造各类数字员工的企业,实在智能一直踏踏实实地探索支撑客户数字化转型,实实在在地助力客户提质降本增效,提升竞争力。
快速推出自研TARS(塔斯)大模型,得益于实在智能在自然语言处理领域深厚的技术积累和落地经验:
2018年,BERT模型提出后,实在智能即率先在国内发布了中文预训练模型,并将其与产品深度融合;
2019年,谷歌发布ALBERT模型论文后,实在智能再次在极短时间内,于谷歌正式开源之前,在国内率先发布中文预训练模型,并牵头发起成立CLUE组织。
2022年底,OpenAI公布ChatGPT后,实在智能密切关注并迅速跟进大语言模型的研究进展;
2023年初,实在智能正式启动TARS大语言模型研发项目,并将目标确定为“构建自研、有效、安全、可信任、可落地的垂直领域大语言模型。”
基于开源基座模型,实在TARS大模型在千亿级高质量Tokens上进行了充分训练,完整复现了Pretrain、SFT和RLHF三个阶段,语言理解能力及指令跟随能力等在横向对比测试中均取得良好效果。
特别地,实在智能积极响应国家互联网信息办公室发布的“关于《生成式人工智能服务管理办法(征求意见稿)》”,在TARS大模型中叠加了多项自然语言处理前沿技术。如:模型的不当言论判别,从而进一步增强了模型的生成效果和安全性。
目前,实在TARS大模型正在进行更全面、更完整的效果评测,相关结果将在近期陆续公布。
TARS大模型的上线内测,意味着实在智能在推动AI技术与RPA产品深度融合方面,再上新台阶!
面对市场环境和前沿科技的快速变化,企业不仅要满足客户的多样需求,还要处理内部庞杂数据、打通数据孤岛、提高经营效率,数字化转型迫在眉睫。


AI技术有助于提高数据处理和决策效率、增强风险预测和控制能力。RPA技术可有效帮助企业减少重复、繁琐人工操作,实现流程自动化的软件。当下,越来越多的政府机构和企事业单位开始关注AI与RPA技术的融合应用,并将其作为数字化转型的关键手段。
很快,实在TARS大模型将与实在RPA实现完美融合。
前者提供自然语言理解及逻辑知识的归纳泛化能力;后者基于实在智能自研的“智能屏幕语义理解技术(ISSUT)”,实现对一切屏幕上一切元素的自动化操作。
接下来,用户无需花费时间精力去学习理解RPA工具常见的“能力组件、变量”等专业知识,也无需一步步拾取各类软件功能元素,手动编排流程。只需通过文字简单描述业务流程,即可生成一个自动化业务流程,生成一个数字员工!
让流程的自动化更加简单,让自动化流程的生成更加智能、高效。
当前,政府和企业在快速推进数字化转型的同时,对信息安全性、准确性也提出了更高要求。
实在TARS大模型全面支持私有化部署,用户可完全自主掌控数据和模型,确保内部敏感数据的安全性,并可根据业务需求进行定制化开发。
值得一提的是,实在TARS大模型还将作为实在智能IDP文档审阅产品的下一代核心引擎,为更多企业提供更准确、高效的文档处理能力。
借助TARS大模型的语言理解和深度学习能力,IDP将升级为Chat-IDP,即为用户提供与文档直接“对话”的能力,使用户可更准确地识别、提取和审阅文档内容,打出一套文档高效审核处理的“组合拳”,大幅提升自动化办公效率。
持续、快速地迭代和创新是AI科技企业保持竞争力的关键。实在智能将继续加大研发投入,坚持技术突破和产品创新双轮驱动,不断推进TARS大模型与超自动化产品矩阵的更多深度融合,也期待与更多合作伙伴共创“人机协同”的丰富场景和精彩未来!