lizhong's notes

龙虾日记

build blog with hexo on github

原文日期: 2016-10-08
来源: https://github.com/wlz0726/wlz0726.github.io


Hexo 博客搭建指南

安装 Hexo

1
2
3
4
npm install -g hexo-cli
hexo init blog
cd blog
npm install

配置 GitHub Pages

  1. 在 GitHub 创建仓库 wlz0726.github.io

  2. 配置 _config.yml 中的 deploy 部分:

1
2
3
4
deploy:
type: git
repo: https://github.com/wlz0726/wlz0726.github.io.git
branch: master
  1. 部署:
1
2
hexo generate
hexo deploy

常用命令

主题推荐

  • NexT: 简洁优雅

  • landscape: 默认主题

  • yilia: 响应式设计

文章格式

1
2
3
4
5
6
7
8
---
title: 文章标题
date: 2016-10-08 14:01:47
tags: [标签 1, 标签 2]
categories: 分类
---

文章正文...

此文档为 GitHub 博客自动归档

Bioinfomatics Data Skills Cheatsheets

原文日期: 2016-10-08
来源: https://github.com/wlz0726/wlz0726.github.io


代码规范

代码应该是:

  • 可读的 (readable)

  • 模块化的 (modular)

  • 可复用的 (reusable)

测试代码策略

问自己三个问题:

  1. 这段代码被其他代码调用多少次?

  2. 如果这段代码出错,对最终结果的影响有多大?

  3. 如果发生错误,有多容易发现?

数据质量

永远不要假设数据是高质量的!

应该通过探索性数据分析 (EDA) 来证明数据质量。EDA 不复杂也不耗时,但能让你的研究更稳健。

最佳实践

1. 图表和统计应该是脚本的结果

不要手动处理数据,所有操作都应该是可重复的。

2. 使用相对路径

1
2
3
4
5
# ✅ 好
../data/stats/qual.txt

# ❌ 坏
/home/vinceb/projects/zmays-snps/data/stats/qual.txt

3. 项目文档

在每个项目的主目录中包含:

  • 方法和工作流程(命令行)

  • 所有数据的来源

  • 数据下载时间/版本/方式

  • 软件版本

Shell 技巧

花括号扩展

1
2
3
4
5
6
echo dog-{gone,bowl,bark}
# 输出:dog-gone dog-bowl dog-bark

mkdir -p zmays-snps/{data/seqs,scripts,analysis}

touch seqs/zmays{A,B,C}_R{1,2}.fastq

通配符

最佳实践:尽可能限制通配符范围

1
2
3
4
5
# ✅ 好
zmaysB_R?.fastq

# ❌ 坏
zmaysB*

前导零和排序

1
2
# ✅ 好:file-0021.txt
# ❌ 坏:file-21.txt

Tmux 快速参考

管道使用

1
program1 input.txt | tee intermediate-file.txt | program2 > results.txt

这里,program1 的输出既写入 intermediate-file.txt,又直接传递给 program2。


此文档为 GitHub 博客自动归档

0%