行情周日聊吧,今日例行周末扯淡。
OpenAI新一轮募资非常顺利,但尴尬的则是募后估值290亿美元,折合2000亿人民币左右。作为对比,A股的两个传说中的大模型票当前市值为昆仑万维800亿,三六零1100亿,加起来正好和OpenAI一样,这就颇有些尴尬了。
当然咯,OpenAI理论上说是一个非营利机构,主要经营目的不是赚钱,这点可能会影响到估值。但考虑到这货至少领先全球其他大模型1-2年的时间,这点估值给人的感觉就是过于克制了。
关于GPT4.0到底聪明到什么程度最近有一个比较全面的比较分析,都是参加各种人类考试得到的成绩,比方说上图中的99%意味着这个考试中表现比99%的人类强。
先简单介绍下GPT4.0参加的几项考试。
GRE和SAT大部分人应该比较熟悉,分别是美国的研究生和本科入学考试,难度说实话都不高,以基础题为主。我年轻时也考过GRE,最简单的方法是刷题库,只要把题库特别是最新题库刷完了,想考低分都难。
我们那时候GRE总分是2400分,我刷了一个多月题库后考了2200多分,身边好几个哥们都是2400满分。
SAT也有题库,只要多刷就能上分,和你的真实水平关系不太大。
Advanced Placement是美国高中的大学先行课程考试,简称AP,其难度大致相当于大学一年级课程。高中通过AP考试不仅有助于申请本科学校,而且直接能抵本科学分。
AP肯定要比GRE难,因为GRE主要是选择题可以直接背答案,而AP有不少主观题,作为人类很难背下来,但AI可以。由于AP也有题库,所以只要是题库里有的题目AI就能给出标准答案。
AP最难的两门课通常认为是英语和英语文学,因为这两门课的主观题几乎都没有标准答案。个人理解就类似于语文作文和阅读理解,新题几乎不可能撞到之前的题库。
Uniform Bar是美国的律师执业考试,以选择题为主,也有题库。这个考试里面都是条条框框的东西,不需要考生自主发挥,就是涉及的范围和题量都比较大,但这显然对AI根本不是问题。
LSAT是法学院入学考试,也有题库,但有不少主观题。
Codeforces Rating是一个难度很高的计算机算法考试,每次的题目是新的,个人理解不会有一个明显的题库让你来背。你必须通过对计算机算法原理的理解,来找出更高效的解法。
GPT4.0在以上各项考试中的表现分别如下:
GRE词汇、SAT阅读、Uniform Bar Exam法律,比90%以上的人类强。
SAT数学、LSAT法律、AP(美国高中开设的大学先行课程)生物、统计、心理学、GRE数学,比80-90%的人类强。
AP化学、心理学2,比60-80%的人类强。GRE写作(54%)、AP微积分(43%)、英语(14%)、英语文学(8%),表现比较差,只比低于60%的分人类强。
最次的则是计算机算法,低于5%。
前几天我不是还说人工智能特别善于编程么?
可能是这样的。人工智能特别擅长的是搬砖,也就是把已经有的代码模块用到另外一个程序中,但并不擅长创造新形状的转头,就是新的算法模块。
总的来说,GPT表现出来的依然是归纳能力强、演绎能力弱,无甚创造力,算是给人类留了条活路。
至于GPT到底有没有真实的理解能力也存疑。
就像我当年考GRE的时候,能得分是因为我背了题库,而不是真的懂了那些稀奇古怪美国人自己都不认识的单词。
考试我是能得分,但在生活和工作中根本不可能发挥作用。
那么我这算是理解了这些知识么?