这篇文章详细介绍了 CellWhisperer 的开发和评估,这是一种新型多模态人工智能模型和软件,旨在通过自然语言聊天实现交互式 单细胞 RNA 测序 (scRNA-seq) 数据探索。CellWhisperer 通过利用对比学习将 转录组数据(RNA 谱)与 文本注释 连接起来,创建了一个统一的多模态嵌入空间。该模型经过精心策划的 超过一百万对 RNA 谱和匹配文本注释数据集进行训练,使其能够进行零样本分类、自由文本搜索和聊天式数据查询。通过将 CellWhisperer 集成到流行的 CELLxGENE Explorer 界面中,研究人员现在可以使用自然语言与复杂的生物数据进行交互,从而促进更直观和包容性的生物信息学分析。
References:
- Schaefer M, Peneder P, Malzl D, et al. Multimodal learning of transcriptomes and text enables interactive single-cell RNA-seq data exploration with natural-language chats[J]. bioRxiv, 2024: 2024.10. 15.618501.