Open-AI 刚刚(gāng)公布了其大型语言(yán)模型的最新版本 ——GPT-4。
GPT-4 可(kě)以更准确地解决你的难(nán)题,多模态的 GPT-4 还可以生成、编辑具有创意(yì)性或技术性的文章,在高级推理方面的(de)表现超过其(qí)前辈(当前公开版 ChatGPT 基于 GPT-3.5)。当然,正如大家所(suǒ)猜测(cè)的那(nà)样(yàng),微软 New Bing 的聊天功能确实基于 GPT-4。
此外(wài),该公司正在与合作伙伴 Be My Eyes 一起测试 GPT-4 的图像输入能力(注:Be My Eyes 是一(yī)款即将推出的(de)智能手机 App,可以识别场景(jǐng)并对其进行描(miáo)述,类似于大家常见的 AI 识图的加强版)。
除了介绍网站,OpenAI 还(hái)提供了描述 GPT-4 功能的技术性论文,以及详细描述其局(jú)限性的系统(tǒng)模型 Card。

OpenAI 计划通过(guò) ChatGPT 及其(qí)商业 API 为用户提(tí)供 GPT-4 的文本(běn)功能支持,但目前还需要等待。IT之(zhī)家这(zhè)里需(xū)要提醒一下,GPT4 目(mù)前仅 ChatGPT plus 账号可用,可选 GPT4 模式进(jìn)行对话,每(měi) 4 小时(shí)限制发(fā)送 100 条消息(xī)。
收费方面,大约 750 个单(dān)词的(de)提示收取(qǔ)约 3 美分的费用,约 750 个单(dān)词的响应则收取 6 美分(就是问和答的区别)。

据介绍,GPT-4 比以前的版本“更大”,这(zhè)意(yì)味着它已经借助比前辈更多的(de)数据进行了训练,并且(qiě)在模型文件中有更多的权(quán)重(chóng),从而使得它(tā)的运行(háng)成本更(gèng)高。
就任务而(ér)言(yán),GPT-4 的表现比(bǐ)前辈(bèi)更好,它可(kě)以遵循自然(rán)语言的(de)复杂指令并生(shēng)成技术或(huò)创意内容,而且它(tā)可以(yǐ)还更深入地(dì)做到这一点:它支持生成和处理多达 32768 个标记(约(yuē) 25000 个(gè)文本单词(cí)),从而实现比前辈更长(zhǎng)的内容创建或文本分析。
OpenAI 表示,GPT-4 错误(wù)答案更少,而且也会减(jiǎn)少(shǎo)偏离话题的可能(néng),也尽可能不会再谈论(lùn)禁忌话题,甚(shèn)至(zhì)在(zài)许多标准化(huà)测试中(zhōng)比人类表现得都要更(gèng)好一些。
例如(rú),GPT-4 在(zài)模拟律师考试的成绩在(zài)考生中(zhōng)排名前 10% 左(zuǒ)右,在 SAT 阅读考试中排(pái)名前 7% 左右,在 SAT 数学考试中排名前 11% 左右。相(xiàng)比之下,GPT-3.5 在律师考试中的得分一般都(dōu)是(shì)倒数 10% 左右。当然,它们考个(gè)研(yán)究生还是没问题(tí)的。

当然(rán),AI 毕竟是 AI,OpenAI 也表示目前 GPT-4 并不完美,它(tā)在很多场景下的能力都不如人类。
据称(chēng),该模型仍然(rán)存在“幻觉(jiào)”或编造事实(shí)的问题,并(bìng)且在事实方面也不一定总是(shì)可靠的,“它倾向于坚持认为它是正(zhèng)确的,即使它(tā)错(cuò)了”。OpenAI 表示,GPT-4 正在努(nǔ)力解决其局限性,例如社会偏见、幻觉和(hé)对抗性提示。