实验一个 AI 大模子需要若干钱?探花 巨乳
OpenAI CEO 山姆 · 奥特曼曾暗意,GPT-4 的实验资本省略 1 亿好意思元(约合东说念主民币 7.3 亿元),改日实验大模子的资本将高于 10 亿好意思元。尚未完成实验的 GPT-5 大模子,为时约半年的一轮实验就耗尽了省略 5 亿好意思元,可见 AI 公司的支拨资本有多高。
但是在 AI 行业却有一个异类,被盛大网友奉为" AI 行业的拼多多",这家公司即是 DeepSeek(深度求索),网传其大模子实验资本压缩到极致,最新推出的 DeepSeek-V3 大模子实验资本仅为 557.6 万好意思元(约合东说念主民币 4070 万元),或者是 GPT-4 的二迥殊之一,辩论约耗尽了 278.8 万个 GPU 小时,参数为 6710 亿,其中激活参数为 370 亿。
DeepSeek 官网的价钱暗意涌现,缓存射中输入价钱仅为 0.1 元 / 百万 tokens,缓冲未射中输入价钱为 1 元 / 百万 tokens,输出价钱则为 2 元 / 百万 tokens,在诸多 AI 大模子中属于最低的一档。(注明:1token 约等于 1.5 个汉字或 3 个英笔墨母)
(图源:DeepSeek 截图)
豆包、通义千问等 AI 大模子,才能较低的版块差未几亦然这个价钱,但性能较强的大模子如 Doubao-pro-128k,输入价钱 5 元 / 百万 tokens,输出价钱为 9 元 / 百万 tokens,Kimi 的 moonshot-v1-128k 输出价钱更是高达 60 元 / 百万 tokens。(注明:数据来自 AI 公司官方)
(图源:雷科技制作)
DeepSeek-V3 超低的实验资本和最低一档的输入、输出价钱,令东说念主不禁狐疑,到底是其他 AI 公司资源运用率太差,如故 DeepSeek 时代实力太强,抑或 DeepSeek-V3 的才能是吹的?
好在,尽管 DeepSeek-V3 的大模子主掀开源和 API 接口使用,但也为用户准备了可以方便使用的网页版。只须对其测试一番,对比与主流大讲话模子的差距,咱们就能获知 DeepSeek 的确切实力。
DeepSeek 页面极为纯粹,主框仅有深度想考、联网搜索、上传文献、发送四个按钮。要是不掀开联网搜索功能,将无法搜索网上连络的信息,只可行为腹地大模子使用,且深度想考和联网搜索无法同期开启,但依然需要电脑联网将问题发送给 DeepSeek。
针对 DeepSeek-V3,小雷准备了四轮测试,包括通用问答、本色纪念、专科数学题、金融学问问答,部分测试还将与豆包、Kimi 等大讲话模子进行对比,以便于更直不雅地不雅察 DeepSeek-V3 的才能。
一、老例问答:节略整洁、可读性高。
作为别称科技裁剪,小雷每天齐会向 AI 辩论"今天科技圈有什么新闻",让 AI 大模子匡助我快速鸠合新闻,绝大多数大模子也能够松驰胜任。于是,小雷将其作为第一轮测试题目。
DeepSeek 为我寻找了 10 条新闻,新闻之间用分割线差异,视觉上愈加昭着明了。每一段新闻的末尾,还会提供可一键直达的网页运动。该款式标测试中,DeepSeek 的亮点在于,新闻的纪念纯粹且杰出了重心,所鸠合的本色也不局限于国内平台,部分讯息来自国际新闻媒体,点击运动可直达国际的新闻网站。意想的是,DeepSeek 还找到了我方的"黑料",DeepSeek-V3 大模子会称我方是 ChatGPT,山姆 · 奥特曼发文复兴,认为原因是数据沾污。
小雷用豆包和 Kimi 鸠合新闻时,豆包回复的本色笔墨太多,本色不够纯粹昭着,Kimi 则过于精简,新闻的纪念基本唯有一句话。
随后小雷还让 AI 推选几首古典音乐,在未联网的情景下探花 巨乳,DeepSeek 依然可以准确回答我的问题,仅仅扫数本色全部酿成了英文。而切换至联网模式后,再次发问疏导的问题,回答的本色则又酿成了华文。
本着求真是心态,小雷又进行了几次测试,发现未联网情景下辩论西方古典音乐时,DeepSeek 给出的回答是英文,辩论中国连络的音乐本色,如周杰伦的歌曲,DeepSeek 就会是华文。DeepSeek 竟然是凭证回答本色的连络性选用讲话,而不是发问所用的讲话,令小雷若干有点骇怪。
一言以蔽之,在老例问答款式中,DeepSeek 解析出色,不管是联网情景还瑕瑜联网情景齐能准确回答出小雷建议的问题,解析涓滴不忘形豆包、Kimi 等国内第一梯队的 AI 大模子。
二、本色纪念:浪漫很精简,重心有缺失。
在之前大模子横评中,小雷曾让豆包、Kimi、文心一言、讯飞星火等多款 AI 大模子纪念小红书发布的《潮水数码白皮书》,浪漫大模子纪念出的本色普遍缺失重心,有车轱辘话往来转的情况。
与大多数大模子疏导,DeepSeek 给出的本色遗失了太多重心,尤其是《潮水数码白皮书》给出的部分事例,DeepSeek 透彻莫得归纳出来。(著名:淡色部分为想考设施,深色部分为正文)
(图源:DeepSeek 截图)
AI 大模子基本存在疏导的问题,纪念本色时容易酿成"归纳大纲和标题",导致无数信息无法展现出来,用户仅凭"脑补"也难以收复出蓝本本色。
偷偷撸就生成的本色而言,DeepSeek 的解析与 Kimi、文心一言较为接近,略强于讯飞星火,稍逊于豆包。能够达到这个遵守,依然很出乎小雷的预见了。
三、数学题解答:快速、准确、有过程。
在数学题解答中,小雷先后准备了三说念数学题,第通盘题是较为简便的小学数学题,第二说念题则是经典的三门问题,DeepSeek 全部松驰回答正确,因而小雷不再展示 AI 给出的谜底,小伙伴们可以我方想考一下。
在 DeepSeek 获取两连胜后,小雷决定给 AI 大模子上一上强度,拿出了也曾打败过多个 AI 大模子的第三说念题:
某班有 39 名同学插足短跑、跳远、投掷三项体育比赛,东说念主数分别为 23 东说念主、18 东说念主、21 东说念主,其中三项比赛全部插足的有 5 东说念主,仅插足跳远的有 3 东说念主,仅插足投掷的有 9 东说念主,讨教仅插足短跑的有若干东说念主?(正确谜底:9 东说念主)
此前的测试中,唯有付费版 o1-preview 辩论出了该问题的正确谜底,豆包、Kimi、文心 3.5、免费版 GPT-4o 等大模子全部回答颠倒。令小雷没预料的是,DeepSeek 竟然给出了正确谜底。
一时候小雷怀疑,是不是经过这段时候的实验,扫数大模子齐能辩论出该问题的谜底了,于是小雷又测试了几款大模子,浪漫豆包和文心 3.5 依然未能回答正确,分别给出了 3 东说念主和 12 东说念主的谜底,升级了 k1 视觉想考模子的 Kimi 和讯飞星火则给出了正确谜底。
除了能够正确回答问题,DeepSeek 还够忽闪展示了想考设施,部分问题还会反复考据谜底,致使使用其他风物再计齐截次,况兼解答问题的速率更是惟一档。
在本轮测试中,DeepSeek 的解析号称优秀,扫数问题全部答对、解答速率快、有想考设施,反而是远近闻名的豆包、文心 3.5 再次折戟,未能解答出第三说念题,DeepSeek 解析出的实力远深广于它的名气。
四、金融问题答疑:精确默契,给出了符合建议。
面向扫数消费者的大讲话模子,于今大多仍免费提供劳动,反而主攻是 B 端阛阓和主打专科功能的 AI 大模子,渐渐收费劳动。C 端阛阓用户众口难调,且很多东说念主不肯意付费使用,唯有打造专科使用场景,面向有对应需求的用户,AI 公司方能有契机竣事盈利。因而在第四轮测试中,小雷准备了通盘金融学问问题:
当阛阓利率飞腾或下落时,债券价钱会若何变化?投资者应若何布置利率波动以保护债券投资组合价值?
这一轮测试中,扫数 AI 大模子给出的谜底大同小异,均能准确解读市利率变化和债券价钱的相干,并给出一些投资建议,包括散布投资、裁减久期、投资债券基金等有策画。
网上金融连络的信息过于零散,查询、挑选、提纯信息的进程也较为坚苦,AI 能很好地料理这一问题,匡助咱们鸠合连络信息并提真金不怕火灵验的本色。
金融问题连络测试中,小雷仍未开启联网搜索功能,DeepSeek 给出的谜底中规中矩,与其他 AI 大模子拉不开差距,但这已饱胀解释 DeepSeek 的优秀,毕竟它的实验资本仅 557.6 万好意思元。
测试 DeepSeek-V3 之前,小雷有点鄙弃这款大模子,OpenAI 实验 GPT 的资本以"亿好意思元"为单元,一个实验资本仅 557.6 万好意思元的 AI 大模子,解析能高到哪去?浪漫实测浪漫狠狠给了小雷一巴掌。
几轮测试下来,除了险些扫数大模子齐存在丢失重心的本色纪念要津,其他几轮测试 DeepSeek 齐拿到了高分,解析涓滴不忘形国内远近闻名的文心一言、Kimi、豆包等 AI 大模子。
在数学题解答款式中,即便靠近豆包、文心 3.5 齐未能给出正确谜底的难题,DeepSeek 依然飞速解出谜底。讯飞星火和 Kimi 前次测试给出了颠倒谜底,此次成效答对,升迁幅度不小。
部分小伙伴看到这里可能就会认为,DeepSeek 花几百万好意思元就能实验出这样优秀的大模子,OpenAI、百度、字节越过齐是在浪用钱。其实否则,DeepSeek 纵令在逻辑推理方面解析出色,但其功能缺少是最大的问题,无法用于创作图片、PPT,也不提供智能体可选,功能相对较少。
(图源:豆包生成)
豆包、文心一言、ChatGPT 等,则持政着"全能大模子"进发,即 Any To Any,用户可以输入任何模态的本色,并输出任何模态的本色。针对很多专科范围,豆包、文心一言纷纷推出了对应的智能体,涵盖生涯、学习、创作等方方面面,这是 DeepSeek 远弗成及的。
关于以笔墨生成为主要需求的用户来说,DeepSeek-V3 是一款可以的 AI 大模子,但若有更多需求,如写长篇演义、创作图片、投资辩论,豆包、Kimi 等免费劳动的 AI 大模子偏激提供的智能体随机更合适。
虽然,DeepSeek 也如实作念到了花小钱办大事,通过更先进的 MoE 架构、多时代会通优化、FP8 搀杂精度实验框架等时代,以及与开源社区互助的步调,在资本较低的情况下,就实验出笔墨生成和逻辑推理才能不输乃至当先主流 AI 大模子 DeepSeek-V3。
实验资本腾贵、竞争愈发浓烈已成趋势,改日几年国表里将有无数 AI 公司倒闭,若何开源与节流已成 AI 公司必须想考的难题,DeepSeek 申斥资本的步调值得其他 AI 公司学习。
25 年 1 月 7 日,CES(国际消费电子展) 2025 行将汜博开幕,雷科技报说念团已飞赴好意思国现场整备,届时咱们将对 CES 张开全程专科报说念,敬请关怀。