Insert blank line using markdown
Insert blank line using markdown
原文日期: 2017-04-18
来源: https://github.com/wlz0726/wlz0726.github.io
Markdown 空行技巧
段落间距
空一行即可:
1 | 第一段 |
强制换行
末尾两个空格 或 <br>
1 | 第一行 |
此文档为 GitHub 博客自动归档
原文日期: 2017-04-18
来源: https://github.com/wlz0726/wlz0726.github.io
空一行即可:
1 | 第一段 |
末尾两个空格 或 <br>
1 | 第一行 |
此文档为 GitHub 博客自动归档
原文日期: 2017-04-18
来源: https://github.com/wlz0726/wlz0726.github.io
ADMIXTOOLS 是哈佛大学 Reich 实验室开发的群体遗传学分析工具包,主要用于:
群体混合分析 (Admixture)
f-statistics 计算 (f2, f3, f4)
系统发育关系推断
基因流检测
1 | # 克隆仓库 |
1 | conda install -c bioconda admixtools |
ADMIXTOOLS 使用 EIGENSTRAT 格式:
.geno - 基因型数据
.snp - SNP 信息
.ind - 个体信息
1 | # 使用 convertf |
parfile 示例:
1 | genotypename: input.bed |
1 | qpAdm -p parfile |
parfile 示例:
1 | popleft: Target |
1 | qpGraph -p parfile -g graphfile |
1 | f4 -p parfile |
parfile 示例:
1 | popfilename: pops.txt |
负值: 表明目标群体是源群体的混合后代
Z 分数: |Z| > 3 认为显著
显著非零: 表明存在基因流
符号: 指示基因流方向
古代 DNA 分析: 检测古代群体与现代群体的关系
人群历史: 推断人群混合事件
疾病研究: 控制群体分层
数据质量: 确保 SNP 质量和覆盖度
样本选择: 选择合适的参考群体
多重检验: 校正 p 值
结果验证: 使用多种方法交叉验证
此文档为 GitHub 博客自动归档
原文日期: 2017-04-17
来源: https://github.com/wlz0726/wlz0726.github.io
确认许可类型
按要求署名(如需)
商业用途需额外确认
此文档为 GitHub 博客自动归档
原文日期: 2017-04-12
来源: https://github.com/wlz0726/wlz0726.github.io
1 | # macOS |
1 | # 总体统计 |
1 | # 最小质量值 |
1 | # 最小深度 |
1 | # VCF → PLINK |
1 | # 从文件读取样本列表 |
1 | # 染色体 |
1 | # 从文件读取位点列表 |
1 | # 核苷酸多样性 (Pi) |
此文档为 GitHub 博客自动归档
原文日期: 2017-04-06
来源: https://github.com/wlz0726/wlz0726.github.io
1 | samtools fastq input.bam > output.fastq |
1 | # 输出两个文件 |
参数说明:
-1: 第一个 read 的输出文件
-2: 第二个 read 的输出文件
-0: 只有一个 read 比对的输出(通常丢弃)
-s: 只有一个 read 比对的输出(通常丢弃)
-n: 保留原始 read 名
1 | # 仅比对上的 reads |
1 | bedtools bamtofastq \ |
1 | picard SamToFastq \ |
质量值格式: 确保与下游工具兼容
双端配对: 保持 read1 和 read2 的顺序一致
文件名: 使用有意义的命名
压缩: 输出 gzip 压缩格式节省空间
1 | samtools fastq input.bam | gzip > output.fastq.gz |
此文档为 GitHub 博客自动归档
原文日期: 2017-03-23
来源: https://github.com/wlz0726/wlz0726.github.io
1 | # 下载 GATK |
1 | bwa mem -t 8 -M reference.fasta reads_R1.fastq reads_R2.fastq | \ |
1 | gatk MarkDuplicates \ |
1 | # 第一步:构建重校准表 |
1 | # 单样本 |
1 | # 合并 GVCF |
1 | gatk VariantFiltration \ |
此文档为 GitHub 博客自动归档
原文日期: 2017-03-21
来源: https://github.com/wlz0726/wlz0726.github.io
1 | # 下载参考基因组 |
输出文件:
.amb - 模糊位点信息
.ann - 序列注释
.bwt - Burrows-Wheeler 转换
.pac - 压缩序列
.sa - 后缀数组
1 | bowtie2-build reference.fasta index_prefix |
1 | hisat2-build reference.fasta index_prefix |
1 | STAR --runMode genomeGenerate \ |
参数说明:
--sjdbOverhang: 读长 -1(如 101bp 读长设为 100)
--runThreadN: 线程数
磁盘空间: 人类基因组索引约需 30-50GB
内存: STAR 索引需要约 30GB 内存
时间: 完整索引约需 1-4 小时
版本: 记录参考基因组版本(GRCh37/GRCh38)
1 | # BWA |
此文档为 GitHub 博客自动归档
原文日期: 2017-02-12
来源: https://github.com/wlz0726/wlz0726.github.io
每页一个核心观点
避免文字堆砌
留白是美德
字体统一(标题 + 正文不超过 2 种)
颜色统一(主色 + 辅色 + 强调色)
风格统一(扁平化/拟物化)
多用图表,少用文字
一图胜千言
使用高质量图片
大小对比(标题 vs 正文)
颜色对比(重点突出)
空间对比(层次分明)
ColorHunt: https://colorhunt.co/
Coolors: https://coolors.co/
Adobe Color: https://color.adobe.com/
标题: 思源黑体、微软雅黑
正文: 思源宋体、苹方
标题: Arial, Helvetica, Montserrat
正文: Georgia, Lato, Open Sans
开场: 用问题/故事吸引注意力
结构: 总 - 分 - 总
结尾: 总结 + 行动号召
互动: 适时提问
此文档为 GitHub 博客自动归档
原文日期: 2017-01-03
来源: https://github.com/wlz0726/wlz0726.github.io
这是我的 Hexo 博客的第一篇文章!
生物信息学学习笔记
编程技巧分享
科研工具推荐
生活随笔
每周至少更新一篇
分享实用代码片段
记录学习心得
总结踩坑经验
Lizhong Wang
生物信息学研究者
编程爱好者
终身学习者
GitHub: https://github.com/wlz0726
微博: @samr
Perl
Python
R
Linux/Unix
Git
Docker
群体遗传学
基因组学
生物信息学算法
🎉 博客正式开通!欢迎交流!
此文档为 GitHub 博客自动归档