首页 > 汽车新闻 > 汽车新闻 > 微软推出iPhone能跑的ChatGPT级模型,网友:OpenAI得把3.5淘汰了

微软推出iPhone能跑的ChatGPT级模型,网友:OpenAI得把3.5淘汰了

发布时间:2024-04-23 15:37:06来源: 15210273549

Llama 3发布刚几天,微软就出手截胡了?

 

刚刚发布的Phi-3系列小模型技术报告,引起AI圈热议。

 

其中仅3.8B参数的Phi-3-mini在多项基准测试中超过了Llama 3 8B

为了方便开源社区使用,还特意设计成了与Llama系列兼容的结构。

 

微软这次打出“手机就能直接跑的小模型”的旗号,4bit量化后的phi-3-mini在iPhone 14 pro和iPhone 15使用的苹果A16芯片上跑到每秒12 token。

 

这意味着,现在手机上能本地运行的最佳开源模型,已经做到ChatGPT水平。

 

在技术报告中还玩了一把花活,让phi-3-mini自己解释为什么构建小到手机能跑的模型很令人惊叹。

 

除了mini杯之外,小杯中杯也一并发布:

Phi-3-small,7B参数,为支持多语言换用了tiktoken分词器,并额外增加10%多语种数据。

Phi-3-medium,14B参数,在更多数据上训练,多数测试中已超越GPT-3.5和Mixtral 8x7b MoE。

(大杯他们目前不打算做)

作者阵容一看也不简单,一眼扫过去MSRA和MSR雷蒙德团队都投入了不少人。

 

那么,Phi-3系列到底有什么独特之处呢?

根据技术报告中披露,其核心秘诀就在于数据

去年团队就发现,单纯堆砌参数量并不是提升模型性能的唯一路径。

反而是精心设计训练数据,尤其是利用大语言模型本身去生成合成数据,配合严格过滤的高质量数据,反而能让中小模型的能力大幅跃升。

也就是训练阶段只接触教科书级别的高质量数据,Textbooks are all you need

 

Phi-3也延续了这一思路,这次他们更是下了血本:

  • 投喂了多达3.3万亿token的训练数据(medium中杯是4.8万亿)
  • 大幅强化了数据的”教育水平”过滤
  • 更多样化的合成数据,涵盖逻辑推理、知识问答等多种技能
  • 独特的指令微调和RLHF训练,大幅提升对话和安全性

举个例子,比如某一天足球比赛的结果可能对于大模型是良好的训练数据,但微软团队删除了这些加强知识的数据,留下更多能提高模型推理能力的数据

这样一来,对比Llama-2系列,就可以用更小的参数获得更高的MMLU测试分数了。

汽车新闻更多>>

长城坦克500 Hi4-Z双电机插电混动版,预售价37.98万,预计明年1月上市 马来西亚电动化转型:汽车零件减少,零部件供应商面临挑战 图森未来宣布更名CreateAI,从自动驾驶转向游戏开发 双门轿跑设计 本田Prelude最新谍照曝光 李翔:汽车变革浪潮下,VAMA是见证者、参与者与推动者 换2.5T动力 现代全新帕里斯帝更多信息曝光 传特斯拉正在与奥斯汀讨论自动驾驶技术 传Rivian已与UAW就建立工会组织达成协议 2024年秦皇岛市部分直属高中招聘教师公告 2024年西安交通大学管理学院管理辅助工作人员招聘公告 2024年辽宁省人民医院赴高校现场招聘高层次和急需紧缺人才公告 2024年辽宁省肿瘤医院赴高校现场招聘高层次和急需紧缺人才公告 2024年随州市电化教育馆选调工作人员公告(1人) 2024年北京市疾病预防控制中心面向2025年应届毕业生招聘公告(26人) 2024年镇江市卫生健康委员会青年人才专场校园招聘公告 2024年扬州市邗江区工业和信息化局招聘编外工作人员公告 2024年汉中市中心医院招聘采供中心档案管理员公告 2024年通化辉南县教育系统招聘急需紧缺专业教师(含专项招聘高校毕业生)公告 2024年厦门市集美区乐安中学(集大附中)非在编教职工招聘简章 2025年松原扶余市招聘高校毕业生带编入伍公告 2025年普洱宁洱县教育体育系统事业单位急需紧缺人才招聘公告 推荐两驱玄影版 2025款红旗HS5购车指南 用产品力支撑高端定位 试驾2024款腾势Z9 推荐1.6T御两驱版 奇瑞瑞虎7高能版购车指南 2024款岚图知音新车商品性评价 亲民性能座驾 试驾新一代名爵MG5 赛道与日常驾驶的完美融合 宝马M5新车图解 捷达VA7被曝将于12月10日上市,外观酷似速腾,能6.99万起售? 广汽丰田开始卷了!就为了让你肆意躺平 第五代胜达的产品力究竟怎么样?