重生之AI教父

CloseAI

首页 >> 重生之AI教父 >> 重生之AI教父最新章节(目录)
大家在看 打穿西游的唐僧 神医萌宝 重生1977年从知青开始 农女有田有点闲 大魏读书人 快穿之吾儿莫方 快穿任务之炮灰来逆袭 和影帝隐婚后她野翻了 豪门第一少奶奶 金仙才觉醒求生系统 
重生之AI教父 CloseAI - 重生之AI教父全文阅读 - 重生之AI教父txt下载 - 重生之AI教父最新章节 - 好看的其他类型小说

323. ChatGPT核心技术(合)

上一章 目 录 下一页 阅读记录

在前世OpenAI得到GPT3之后,为了发展出ChatGPT级别的智能,他们曾经做过两种不同路线的尝试。

OpenAI将一批模型命名为达芬奇,分为代码版达芬奇和文本版达芬奇两种,顾名思义,一种用于代码,一种用于文本语言。

这两兄弟可以算作是第一版的GPT3.5,也就是ChatGPT的原始版。

对比原本有点笨笨的GPT3,两兄弟已经开始展现出不少关键能力。

比如合理的响应人类的指令。

他们针对人类的输入内容,回应会显得非常合理,给人感觉像是在进行对话和思索。而此前的GPT3,会经常复读相关,但是根本没用也不是回答的句子。

比如可以对从未见过的任务和知识内容进行应对,这一点是至关重要的。

如果模型只能对训练集内有的文本进行理解和回答,那么上线以后是完全没法用的。

广大民众的想象力是无限的,分分钟就会发现智能的漏洞所在,进而对这款智能失去兴趣,这也是为什么GPT3在人工智能领域外几乎没有什么水花。

最重要的一点,是模型具备了【思维链】,能够对比较长的句子和事件的因果关系进行相当复杂的推理。

这一点也是GPT3几乎不具备的。

思维链的能力至关重要,它不仅使得模型能够更加聪明的理解人类用户的输入,更加关键的地方在于强化了多轮对话的前后文理解能力。

它使得语言模型仿佛具有了相当的记忆力,用户每次输入内容和进行对话的时候,几乎不需要过多的提及之前的内容,模型就仍旧能够串起前文,理解用户的意图。

这些新的能力,是使得GPT3.5完全蜕变,成为全世界目光焦点的关键所在。

而与GPT3相比,模型的参数和训练的数据变化其实很小。

所以孟繁岐才会认为,数据和模型规模固然重要,但还不够产出ChatGPT这样聪慧的智能。

在此基础之上,还需要另做文章,并且工程量不小。

这些操作和技巧,就是OpenAI最成功产品,ChatGPT的核心科技。

“首先要做的两件事是【指令微调】和【代码训练】。”孟繁岐如今手下已经有了好几十人,既然付工资,该让他们做的事情当然不用客气。

指令微调到底是否改变了模型的性能,这个问题其实并不好说。

不过前世有很多研究证明,指令微调的确可以使得模型的输出更加符合人类的风格,符合人类的偏好。

或许,微调前的模型其实已经理解了内容,掌握了对应知识,但它表达的方式和风格并不是人类的风格,又或者说,它不知道应该如何表达。

这也就导致了人类对它们的回应评价不高。

“大家不要小看指令微调,如果说随机参数生成的大模型就像是人类婴儿,经过首轮训练的GPT就像是刚刚完成九年义务教育的中学生。他们有基础的知识和写作能力,但如果想让他们在特定任务上独当一面,还需要进行专门的实习锻炼。”

“指令微调就像是一种引导,让大模型在少量的训练调整中,大概理解什么样的问题需要检索什么样的知识,如何回答才是更好的方式。”

“这种模式,我们之前在做AI医生的时候,已经有过非常详尽的流程和模版了,不熟悉的同事可以先去学习一下。”孟繁岐知晓这件事的重要性,因而从两年前开始收集数据的时候,早就规定了收集数据需要的格式。

一步到位,为后面省了不少事情。

上一次AI医生,之所以能用数亿的参数量做到那么好的效果,指令微调策略是贡献很大的。

他使得AI模型能够显得非常自信专业,很像是具备特定领域专业知识的老医生。

并且时刻知道自己的身份,会提醒患者去医院确认情况,不会过于自信。

“这一次的主要挑战在于我们要打造一个通用的语言大模型智能,因此多个方面和领域都需要微调,任务种类可能达到数千的级别。”

“我留给大家的时间并不多,可能只允许你们失败一次。有任何问题及时跟我联络协调,不要硬着头皮耗,到最后耽误了整体的进度,奖金扣光!”

孟繁岐平时对于薪水发放很好说话,但关键时刻也不会容许有人掉链子。

想做ChatGPT这样的通用模型,这一整套流程需要大家齐心协力完成,单只靠几个已经熟悉了这个过程的小团体就显得不够了。

【指令微调】需要用量来堆,前世大家的总结是,【对没有见过的指令也能做出正确反馈】这种奇特的智能能力,是在模型训练的指令数量超过一定程度之后,自动出现的。

很多家机构和模型,都在自己的训练过程中,发现了这样的现象。

说难听点就是,大力出奇迹了,量变产生了质变,并没有谁提前预料到了这个结果。

而另一个关键因素【代码训练】,则是大模型产生了【思维链】的一大主要原因。

GPT3的训练阶段,数据中没有包含任何代码,它基本不具备【思维链】能力。

谷歌的PaLM,含有大约百分之5左右的代码数据,最终得出的模型具备【思维链】的能力。

这章没有结束^.^,请点击下一页继续阅读!

喜欢重生之AI教父请大家收藏:(m.kuaiyankanshu.org)重生之AI教父快眼看书更新速度全网最快。

上一章 目 录 下一页 存书签
站内强推 打穿西游的唐僧 大魏读书人 金仙才觉醒求生系统 替身玩玩而已,金主他认真了 主播收敛点,警察叔叔抓不过来了 一抹匠心瑶琴传 科技之神从技校校长开始 下凡后,我被废太子娇养了 重生1977年从知青开始 快穿任务之炮灰来逆袭 离婚365次 港综之无间道 木叶之千叶传说 全球游戏:他们都不正常 锦绣农女种田忙 神医娇妻是大佬 校园全能王牌少女 武装魔女 转生魅魔的我是否搞错了什么 我的属性修行人生 
经典收藏 都市医武仙尊 小生真不是书呆子 异界军火帝国 明末之席卷天下 抗战:从周卫国参军开始 砂隐之我给穿越者丢人了 致命热恋 异界调查局 云梦巅峰 最后一个炼气士 在大佬怀里当团宠 伴侣的样子我能想到的只有你 穿越S7,你管这叫辅助? 百变巨兽 我的姑奶奶是修仙大佬 大乾御灵官 杨氏崛起之啃孙成仙 大明:当皇帝,太难了! 斗罗之天象独尊 我不太会训练精灵! 
最近更新 打穿西游的唐僧 神医萌宝 重生1977年从知青开始 光阴之外 农女有田有点闲 四合院之饮食男女 锦绣农女种田忙 体坛之重开的苏神 大魏读书人 快穿之吾儿莫方 快穿任务之炮灰来逆袭 和影帝隐婚后她野翻了 豪门第一少奶奶 科技之神从技校校长开始 谍海王者 金仙才觉醒求生系统 小生真不是书呆子 明克街13号 一抹匠心瑶琴传 都市医武仙尊 
重生之AI教父 CloseAI - 重生之AI教父txt下载 - 重生之AI教父最新章节 - 重生之AI教父全文阅读 - 好看的其他类型小说