K2-上海交通大学

是一个地球科学的开源大预言模型

K2是一个地球科学的开源大预言模型。首先通过收集和清理的地球科学文献(包括地球科学开放获取论文和维基百科页面)对 LLaMA 进行进一步预训练,然后使用知识密集型指令调优数据(GeoSignal)。

初步评估采用GeoBenchmark(由NPEE和AP Test on Geology、Geography、Environmental Science组成)作为基准。与具有相似参数的几个基线模型相比,K2 在客观和主观任务上的表现优于基线。

我们介绍 K2 (7B),它是一个开源语言模型,首先在收集和清理过的地球科学文献(包括地球科学开放存取论文和维基百科页面)上对 LLaMA 进行进一步预训练,然后使用知识密集型指令调整数据(GeoSignal)进行微调。在初步评估中,我们使用 GeoBench(由 NPEE 和关于地质学、地理学和环境科学的 AP 测试组成)作为基准。与参数相似的几个基准模型相比,K2 在客观和主观任务上的表现都优于基准模型。在该资源库中,我们将共享以下代码和数据。

上月数据概览

月访问量4.75亿对比上月
-5.57%
月PV28.97亿
平均访问时长394秒跳出率36.20%人均访问页面数6
月活1.19亿月活(去重)9189.46万人均访问次数4.00

热门国家/地区访客分布

国家流量占比月访问量人均访问时长人均访问页数跳出率
洪都拉斯
1.45%
-33.75%
283秒332.22%
亚美尼亚
0.65%
0.00%
0秒1100.00%
黑山
8.30%
2426.39%
892秒427.82%
南非
6.42%
-89.63%
0秒122.76%
捷克
5.51%
19.12%
14秒163.58%