打开PhyloSuite

  1. 解压压缩包,找到PhyloSuite.exe并双击打开
    image-20240422000623832

PhyloSuite的使用

使用PhyloSuite进行系统发育分析需要用到线粒体或叶绿体的.gb文件

  1. 按照下图所示步骤进行操作导入gb文件,在此,我们以本地选择文件(a)为例。选择Arabidopsis thaliana(NC_037304)和Cucurbita pepo(NC_014050 )两个物种。

image-20240422002654350

image-20240422002902111

  1. Extract导入的gb文件:在导入成功后,我们对导入的文件进行Extract,如下图所示。

image-20240422003355077

  1. 如果你分析的是线粒体就选择线粒体,叶绿体同上。这里我们以线粒体为例。选择好后,其余参数一般保持不变,然后点击start即可。

image-20240422003433413

  1. 运行完成后,会出现如下图所示的界面,直接点击ok会在文件管理器中打开,点击cancel则会直接关闭窗口

image-20240422003630129

  1. 在程序的主界面,会出现如下内容,我们点击CDS_NUC。建议可以点击上面的name将文件排序一下。

image-20240422103429099

image-20240422004024184

  1. 筛选共有基因:接下来,我们在点开CDS_NUC之后,要进行共有基因的筛选。共有基因越多,构建的系统发育树越准确假设你选择了20个物种进行系统发育分析,那么共有基因就是这20个物种都包含的基因。以atp1.fas为例,双击atp1.fas,如果在下图右边所示的窗口中有20行数据(也就是20个物种),那么atp1就可以选。如果没有20个,那这个基因就不可以选,即使有19个物种也不行。如果不是共有基因,可以右键直接删除。
    当然,具体情况要具体分析,比如由于注释不统一的问题,相同基因名称可能会不一样,另外也要考虑基因别称的因素。此外,如果在很多基因中,都是只有某一个物种缺少这些基因,那么可以考虑删除这个物种。
    在此,为了方便,我以两个物种的

    基因别称 基因名
    orf25 atp4
    orfB atp8
    orfX mttB
    NAD nad
    ATP atp
    COX cox
    ccmFN ccmFn
    ccmFN ccmFn
    ccmFC ccmFc
    atp1- atp1
    atp6- atp6
    atp8- atp8
    ccmC- ccmC
    cob- cob
    cox2- cox2
    nad4L- nad4L
    rps19- rps19
    rps7- rps7
    sdh3- sdh3
    mat-R matR
    coxI cox1
    coxIII cox3
    tatC mttB

image-20240422110614936

image-20240422004059625

  1. MAFFT序列比对
    筛选完共有基因后,使用mafft进行序列比对。

image-20240422110928205

点击文件夹,选择之前筛选的共有基因文件夹,

image-20240422111003105

image-20240422111206006

ctrl+A选择全部,点击打开

image-20240422111239980

进行如下图所示的操作,点击ok

image-20240422111343293

点击start,注意不要有中文路径

image-20240422111439496

  1. 连接序列

image-20240422113456170

选择比对好的序列,进行连接

image-20240422113520421

image-20240422114047298

  1. IQ-Tree构建系统发育树

选择上面的.phy和.fas文件构建系统发育树,注意选择外群,其余参数可以不变

image-20240422114508804

image-20240422114306508

  1. 建树完成后,打开结果文件夹,iqtree选择的模型在.log文件夹中,可使用itol在线网站(iTOL: Interactive Tree Of Life (embl.de))对.treefile文件进行可视化和编辑

image-20240422204213269