OrthoFinder结果绘制Venn图
文件准备在运行完OrthoFinder程序之后,会在目录中生成一个OrthoFinder文件夹,里面有一个Results文件夹,Result文件目录如下图所示 绘制韦恩图所需要的文件是Orthogroups中的Orthogroups.GeneCount.tsv 整理Orthogroups.GeneCount.tsv文件,删除total列,从第二列开始,将每一行中不为零的数据改为第一列中Orthogroup的名字,将带0的数据去掉。使用extract_GeneCount_to_VennFile_Linux.py或extract_GeneCount_to_VennFile_windows.py脚本一步到位。 脚本获取位置: https://github.com/sunning03/extract_GeneCount_to_VennFile 脚本使用Windows版脚本使用方法input_file:输入tsv文件路径 output_file:输出文件路径 Linux版脚本使用方法1python GeneCount_to_VennFile_windows.py...
PhyloSuite使用教程
打开PhyloSuite 解压压缩包,找到PhyloSuite.exe并双击打开 PhyloSuite的使用使用PhyloSuite进行系统发育分析需要用到线粒体或叶绿体的.gb文件 按照下图所示步骤进行操作导入gb文件,在此,我们以本地选择文件(a)为例。选择Arabidopsis thaliana(NC_037304)和Cucurbita pepo(NC_014050...
ncbi下载文件
1. 登录NCBI网站首先登录ncbi网站:National Center for Biotechnology Information (nih.gov) 2. 查询物种以查询Lycopodium japonicum(石松)的线粒体为例, 选择核苷酸数据库 输入物种名 点击search 然后可以进行一些参数设置,一般是Sort by Sequence Length,如果accession number 有NC开头的,就尽量选NC的那一个。然后点进去。 3. 文件下载 点击右边的send to,如果想下载.genbank或者.fasta文件,直接按照上面的步骤来就可以;如果是想下载基因的序列,则在第二步选择coding_sequence文件直接下载即可。
dispersed repeats 分析
打开网站使用在线网站Reputer(BiBiServ2 - REPuter (uni-bielefeld.de))进行散在重复序列分析。 点击Submission。 上传文件点击upload上传fasta文件,其他的参数保持默认就行。 上传成功后点击next。 设置参数 左边的Match Direction全都选上 右边我使用的参数:Hamming Distance: 3Maximum Computed Repeats: 5000Minimal Repeat Size: 30 设置好之后,点击next。 分析并导出结果点击 start calculcation 等它运行完,结果就出来了 然后自行下载文件即可。 第二行 454458: 序列长度, 后面的-3,8 分别为maximum allowed distance, minimum repeat size 数据一共有7列: 重复序列1的长度 重复序列1的起始位置 重复序列类型:Forward (direct) [F]; Reverse [R]; Complement [C]; Palindromic...
SSR分析
使用Misa(Misa-web - IPK Gatersleben (ipk-gatersleben.de))在线网站进行SSR分析 填写接受结果的邮箱输入要进行分析的文件: 可使用序列的NC号 使用本地文件 输入项目名,做到见名知意调整SSR参数一般调整为:10,5,4,3,3,3 点击start例: 之后会进入这个页面,分析完成后,网站会自动把结果发送至你填写的邮箱。 网站会发送给你两个邮件,一个是通知,不用管它,分析结果在另一个文件中。 打开这个压缩包,里面有个.statistics文件,打开 文件结果 汇总结果 详细结果 其实箭头所指的数字就是total,如果觉得不方便看的话,可以在第一列后边加个tab缩进。 调整后的结果图:
blast
下载blast12wget -c ftp://ftp.ncbi.nlm.nih.gov/blast/executables/blast+/LATEST/ncbi-blast-2.10.0+-x64-linux.tar.gztar -xvzf ncbi-blast-2.10.0+-x64-linux.tar.gz 构建数据库1makeblastdb -in genome.fasta -dbtype nucl -parse_seqids -out...
我报路长嗟日暮
...
孙宁的博客
大家好呀!欢迎来到Sunning的博客。如果大家有什么问题,可以邮件联系我:sunning@njfu.edu.cn。我将会在博客中写一些关于工作和生活方面的事。目前博客正在建设中~ 工作计划: 网站的外观主题 菜单栏 主页 学习工作 做生信用到的软件 画图的命令 写的脚本和代码 出版的文章 证书,奖项 生活 看过的书 看过的电影 看过的动漫 做的手工(图片,教学视频) 每天一首诗 小宁的植物花园 日记 网站的内容: 用到的一些网站 做的手工 要做的事情 已经发表的文章 使用到的命令: 123456hexo clearhexo ghexo serverhexo dhexo new 'chenge-first-blog'hexo
心灵的微光
2023年12月18日2023年12月15日在对SNP位点进行验证时,并没有考虑到含有内含子的CDS,下面要解决如何把内含子考虑在内。要参考贺同学的代码,使用BioPython。12月17日已解决