找回密码
 立即注册

今日: 0|昨日: 0|帖子: 41|会员: 3638|欢迎新会员: solar_umPt

AI大模型TOP20

2023年随着OPENAI公司的ChatGPT横空出世,引发了全球的AI大模型的研发高潮。中国的科技企业和研究机构也纷纷加入这个角逐。根据《中国人工智能大模型地图研究报告》不完全统计,目前国内已经发布了79个参数规模在10亿以上的大模型,可以说“百模大战”已经开始。为了跟进和评估国内外的AI大模型,式问ASKAI论坛特别推出“式问AI大模型挑战赛 ”,我们从国内外领先的大模型产品中精选20个(TOP20),供大家试用或内测,并从使用中感受AI大模型的进步、优缺点,以及使用中的问题反馈。TOP20大模型列表会根据大家的评测和反馈情况,做动态的调整和更新。并欢迎会员朋友们推荐优秀的产品和内测链接到本论坛。

2 / 2

新版块名称

2 / 3

ChatGPT

ChatGPT(全名:Chat Generative Pre-trained Transformer),是OpenAI [1] 研发的聊天机器人程序 [12] ,于2022年11月30日发布 [2-3]。ChatGPT是人工智能技术驱动的自然语言处理工具,它能够基于在预训练阶段所见的模式和统计规律,来生成回答,还能根据聊天的上下文进行互动,真正像人类一样来聊天交流,甚至能完成撰写邮件、视频脚本、文案、翻译、代码,写论文 [21] 等任务。

7 / 9

文心一言

文心一言是百度打造的全新一代知识增强大语言模型,具备多轮对话、文学创作、多模态生成、数理逻辑推算等技术特性,可以高效便捷地帮助人们获取信息、知识和灵感。它能够与人对话互动,回答问题,协助创作,高效便捷地帮助人们获取信息、知识和灵感。

盘古大模型

盘古大模型由华为出品,由CV,NLP,多模态,预测和科学计算5大基础模型组成,可实现文本生成、图片生成、代码生成、图片理解、气象预测、智能助手打造等多种功能。华为盘古大模型作为通用AI预训练模型,可以广泛应用于矿山、药物分子、铁路、气象、海浪、制造等领域,提供智能化的解决方案。

通义大模型

通义大模型是阿里大模型的统一品牌,覆盖语言、听觉、多模态等领域,致力于实现接近人类智慧的通用智能,让AI从“单一感官”到“五官全开”。目前,阿里通过通义大模型打造了通义千问、通义万相和通义听悟3款生成式AI产品。

星火大模型

科大讯飞推出的新一代认知智能星火大模型,拥有跨领域的知识和语言理解能力,能够基于自然对话方式理解与执行任务,包括语言理解、知识问答、逻辑推理、数学题解答等。星火大模型从海量数据和大规模知识中持续进化,实现从提出、规划到解决问题的全流程闭环。

ChatGLM

ChatGLM-6B是清华大学研发的一个开源的、支持中英双语的对话语言模型,基于 General Language Model (GLM)架构,具有 62 亿参数。结合模型量化技术,用户可以在消费级的显卡上进行本地部署(INT4 量化级别下最低只需 6GB 显存)。ChatGLM-6B使用了和ChatGPT 相似的技术,针对中文问答和对话进行了优化。经过约 1T 标识符的中英双语训练,辅以监督微调、反馈自助、人类反馈强化学习等技术的加持,62 亿参数的 ChatGLM-6B 已经能生成相当符合人类偏好的回答。

悟道·天鹰

悟道·天鹰(Aquila)是由智源人工智能研究院研发的语言大模型,是首个具备中英双语知识、支持商用许可协议、国内数据合规需求的开源语言大模型。Aquila系列模型的中文语料来自智源多年积累的中文数据集,包括来自1万多个站源的中文互联网数据(其中99%以上为国内站源),以及获得国内权威机构支持的高质量中文文献数据、中文书籍数据等。仍在持续积累高质量、多样化的数据集,并源源不断加入Aquila基础模型后续训练中。

曹植大语言模型

“曹植”由达观数据研发并推出,作为垂直专用的国产大语言模型,具有长文本、垂直化和多语言的特点,通过并联多种模型和知识图谱,曹植大模型支持多种语言长文本的自动化写作和多语种翻译等功能,全方位赋能长文档写作、机器翻译、语义分析审核、知识问答、text-to-SQL 等场景,可针对不同行业、领域的文案需求,进行深度优化和个性化定制。可准确完成多类型、复杂结构的长文本写作,自动起草多种类型的文档,同时具有自动排版、智能纠错、文本润色、自动生成摘要等特色功能。还将实现多模态内容生成,如长文档中的表格、图表、图片等;支持中文、英文、法语、德语、日语、韩语等数十种语言的写作。

书生·浦语

书生·浦语InternLM是由上海人工智能实验室研发并推出;InternLM是在过万亿 token数据上训练的多语千亿参数基座模型。通过多阶段的渐进式训练,InternLM 基座模型具有较高的知识水平,在中英文阅读理解、推理任务等需要较强思维能力的场景下性能优秀,在多种面向人类设计的综合性考试中表现突出。在此基础上,通过高质量的人类标注对话数据结合 RLHF 等技术,使得 InternLM 可以在与人类对话时响应复杂指令,并且表现出符合人类道德与价值观的回复。

Baichuan-7B

Baichuan-7B是由百川智能开发的一个开源可商用的大规模预训练语言模型。基于 Transformer 结构,在大约 1.2 万亿 tokens 上训练的 70 亿参数模型,支持中英双语,上下文窗口长度为 4096。在标准的中文和英文 benchmark(C-Eval/MMLU)上均取得同尺寸最好的效果。

ChatLaw法律大模型

ChatLaw法律大模型是由北京大学研发,目前开源的仅供学术参考的版本底座为姜子牙-13B、Anima-33B,使用大量法律新闻、法律论坛、法条、司法解释、法律咨询、法考题、判决文书等原始文本来构造对话数据。

本草中医药

哈尔滨工业大学本草大预言模型,原名:华驼HUATUO,经过中文医学指令精调/指令微调(Instruct-tuning) 的LLaMA-7B模型。通过医学知识图谱和GPT3.5 API构建了中文医学指令数据集,并在此基础上对LLaMA进行了指令微调,提高了LLaMA在医疗领域的问答效果。

OpenBMB

OpenBMB开源社区由清华大学自然语言处理实验室和智源研究院语言大模型加速技术创新中心共同支持发起。CPM-Bee-10B是完全开源、可商用的中英双语基础模型,参数容量达百亿级,利用Transformer自回归架构,在万亿级代币的海量语料库上进行了预训练,拥有卓越的基础能力。

360智脑

360智脑是一个千亿参数大模型,涵盖十大能力数百项细分功能,目前已升级至4.0版本。360智脑具备十大核心能力,维度涵盖数百项细分功能,可覆盖大模型全部应用场景。360智脑在多模态等关键能力上完成迭代,在国内首发大模型定制AI数字人及文生视频功能,接入360旗下全端产品,重塑人机协作新范式。

虎博TigerBot

虎博科技TigerBot是一个多语言多任务的大规模语言模型(LLM)。根据 OpenAI InstructGPT 论文在公开 NLP 数据集上的自动评测,TigerBot-7B 达到 OpenAI 同样大小模型的综合表现的96%。

山海

云知声—山海大模型是最新一代认知智能大模型,拥有丰富的知识储备,涵盖科学、技术、文化、艺术、医疗、通识等领域。与她对话即可获取信息、知识和灵感,是人类的良师益友,也是灵动强大的智能助理。

商汤日日新

商汤推出的“日日新”大模型体系包含自然语言生成、文字生成图片、感知模型标注和模型研发等功能。基于“大模型+大算力”战略,在通用人工智能领域取得突破。该大模型系列能够提高文案创作、线上问诊、秒做视频等方面的效率和质量。

天工

昆仑万维的“天工”作为一款大型语言模型,拥有强大的自然语言处理和智能交互能力。它能够实现智能问答、聊天互动、文本生成等多种应用场景,并具备丰富的知识储备,涵盖科学、技术、文化、艺术、历史等领域。如果你需要文案创作、知识问答、代码编程、逻辑推演、数理推算等功能,天工将是你的得力助手。

孟子

澜舟科技的“孟子”是一款基于团队自研技术的大规模预训练语言模型。它可以处理多语言、多模态数据,并支持多种文本理解和文本生成任务。无论你需要进行公告抽取、小说生成、情感分类、新闻摘要、问答系统还是图文互检,孟子模型都能快速满足你不同领域、不同应用场景的需求。

MOSS

MOSS是复旦大学自然语言处理实验室发布的国内第一个对话式大型语言模型。

义乌小商AI

欢迎来到义乌小商品城!hinagoods.com是义乌小商品城最新推出的全球首个商品贸易领域大语言模型,以及全新升级的Chinagoods AI智创服务平台聚焦AI人工智能新技术在小商品产业供需两端的落地应用。Chinagoods AI智创服务平台智慧模型涵盖AI对话、AI生成商品详情、AI一键生成视频、AI数字人等应用。

QQ|手机版|小黑屋|式问社区-科技驱动创新,探索无限可能! ( 浙ICP备2023018861号-1|浙公网安备 33011002017220号 )

GMT+8, 2024-5-21 14:39

Powered by Discuz! X3.5

© 2001-2023 Discuz! Team.

返回顶部