TechFeed

归档 · 2023 年 10 月

2023 年 10 月 3 篇 / 3 天 ← 回到主页

10月26日周四2023-10-261 篇

10月17日周二2023-10-171 篇

EleutherAI
Llemma:面向数学的开源语言模型Llemma: An Open Language Model For Mathematics

ArXiv | Models | Data | Code | Blog | Sample Explorer 今天我们发布了 Llemma:用于数学的 7 亿和 34 亿参数语言模型。Llemma 模型以 Code Llama 权重初始化,然后在 Proof-Pile II 上进行训练,后者是一个 5500 亿 token 的数学数据集…

ArXiv | Models | Data | Code | Blog | Sample Explorer Today we release Llemma: 7 billion and 34 billion parameter language models for mathematics. The Llemma models were initialized with Code Llama weights, then trained on the Proof-Pile II, a 55 billion token dataset of mathemat…

10月13日周五2023-10-131 篇

EleutherAI
第二届新英格兰 RLHF 黑客马拉松The second New England RLHF Hackers Hackathon

引言 重新点燃合作精神,新英格兰 RLHF 黑客(NERH)于 2023 年 10 月 8 日在布朗大学举办了第二届黑客马拉松。继首届黑客马拉松的成功之后,本次活动同样充满热情,并带来了新的…

Introduction Rekindling the spirit of collaboration, the New England RLHF Hackers (NERH) hosted their second hackathon at Brown University on October 8th, 2023. Stepping up from the success of our inaugural hackathon, this event was fueled by the same enthusiasm but with a fresh…

归档按月浏览全部历史