BioMart是Ensembl的一个Web工具。
点击进入上面的网址,点击BioMart,进到下图页面:
为方便演示,如何用BioMart进行gene ID转换,这里准备了一个包含15个人类的RefSeq mRNA ID列表,并转成Ensembl数据库的Gene ID。
Ensembl数据库,下拉选最新版本的Ensembl Genes 96,点击选择人类对应的数据集Human genes(GRCh38.p12)。
Human genes(GRCh38.p12)下的Filters,点击选中,在Input external reference ID list右侧下拉框选择输入的gene ID类型,这里选择RefSeq mRNA ID(s)。
接下来将准备的ID列表复制粘贴到输入框(最多可提交500个ID)
注:如果是芯片探针ID,可以选择Input microarray probes/probesets ID list下对应的ID,输入框最多可提交500个ID
点击Attributes,选择输出ID类型,这里勾选Ensembl数据库的Gene stable ID。
点EXTERNAL前面的加号[+],可选择转成Ensembl之外其他数据的ID,并且,可将一种ID同时转成多种ID,包括GO ID。
为了将Ensembl ID与原来输入的RefSeq mRNA ID一一对应,输出结果中仍加入RefSeq mRNA ID。
点击Count按钮(标注①),可统计提交的gene ID 数和当前物种的总基因数;
点击Results按钮(标注②),可提交转换任务。
转换结果如下
点击GO按钮,可将结果以制表符分隔的文本格式下载下来。
注意,一个RefSeq mRNA ID(或NCBI gene ID)可能对应多个Ensembl gene ID,见下图: