阿联酋科技创新研究所发布Falcon-40B语言模型,位列榜首
【本站】6月13日消息,近日,阿联酋科技创新研究所(TII)成功研发出了一款具有里程碑意义的语言模型Falcon-40B,该模型在Hugging Face的OpenLLM排行榜上名列第一,并一直保持领先地位,胜过了LLaMA、StableLM和RedPajama等竞争对手。
据悉,Falcon-40B语言模型是利用384颗GPU进行为期两个月的训练,并利用近5亿个Token进行训练而成。为了提高训练质量,研究团队自行构建了一套工作流程,筛选出高质量的数据,供AI模型进行训练。经过多个基准测试,该模型在性能上表现出色,超过了LLaMA、Vicuna和Alpaca等模型。
此外,团队还引入了“多重查询注意力”机制,以提高模型的效率。该机制允许模型对每个Token进行多次查询,从而更好地表示同一序列中不同Token之间的关系。这样一来,模型在加速计算效率的同时降低了复杂性,进而提升了整体的可维护性。
阿联酋科技创新研究所首席执行官Ray O. Johnson博士表示:“2023年将是人工智能之年。Falcon模型对我们来说具有里程碑意义,但这只是个开始。”
据本站了解,Falcon模型已在Hugging Face平台上开源,目前已有Falcon-7B-Instruct和Falcon-40B-Instruct等版本可供使用。这一突破将进一步推动人工智能领域的发展,并为相关领域的研究和创新提供有力支持。
相关文章
- 贵南高铁贵州段联调联试成功结束,进入运行试验阶段
- 贵南高铁接触网全线贯通,为下一步线路送电和联调联试打下基础
- 银兰高铁今日全线开通运营:银川至兰州最快 2 小时 56 分可达
- 集大原高铁山西段建设取得新进展:设计时速 250 公里
- 冲击400公里时速!成渝中线高铁马上开工 投资733亿元
- 跨越时代的发展历程:比亚迪新能源汽车的辉煌征程
- 四年后再次上演:腾讯再次提起多闪用户数据归属诉讼
- X社交媒体平台推出多项敏感度调整选项,广告商定制品牌安全策略
- 《逆水寒》与《巅峰极速》表现亮眼 网易移动游戏再度崛起
- 智能体验升级 华为HarmonyOS 4引领操作系统创新!
- 火星洞察号数据揭示:火星自转加速现象!
- 6月全球半导体销售额增长1.7% 逆势上扬
- 好莱坞罢工预计几周内结束,华纳兄弟探索公司节省数亿美元
- 华为开发者大会游戏服务论坛:飞鱼科技宣布《保卫萝卜 4》在HarmonyOS上开发
- 东方航空空中Wi-Fi服务突破高空限制,乘客飞行全程畅享网络
- 《PokemonPresents》定于8月8日举行!

