article cover

哈佛大学开放百万公共领域书籍数据集,助力AI模型训练 科技新闻

哈佛大学日前宣布,通过其新成立的机构数据倡议(Institutional Data Initiative, IDI),将提供一个包含近100万本公共领域书籍的数据集,用于训练人工智能模型。该项目得到了微软和OpenAI的支持,并包含了由谷歌图书扫描的、版权保护已到期的书籍。这些书籍涵盖了从经典文学作品到专业学术文本的广泛内容,为研究人员和开发者提供了一个丰富...
一把老骨头 发布于