突破性的人工智能解码复杂基因组:Evo 2 在数万亿个碱基上进行训练

Evo 2 是一个开源人工智能系统,已经接受了来自生命所有三个领域的基因组的训练,即使是最复杂的基因组中也可以开发关键特征的内部表示。
Evo 2 是一个开源人工智能系统,已经接受了生命所有三个领域(细菌、古细菌和真核生物)的基因组训练。经过数万亿个 DNA 碱基对的训练后,这个强大的人工智能已经开发出即使是最复杂的基因组(包括人类基因组)中关键特征的内部表示。
这一突破是在 Evo 最初开发出来之后实现的,Evo 是一种人工智能系统,能够正确识别序列中的下一个基因,或者在收到一组相关基因的序列提示时提出全新的蛋白质。然而,该系统仅限于处理细菌基因组,因为它们倾向于将相关基因聚集在一起——这一特征在更高级生物体的复杂基因组结构中没有发现。
Evo 背后的团队并没有被这一挑战吓倒,他们开始扩展其人工智能系统的功能。其成果是 Evo 2,这是一种开源人工智能,经过了前所未有的大量遗传数据的训练,使其能够深入了解复杂基因组中发现的复杂特征,包括调控 DNA 和剪接位点 - 人类难以识别的元素。
{{IMAGE_PLACEHOLDER}}来源: Ars Technica


