问题:判断变异位点是否存在panel
详细描述:
1. 一组变异位点数据,如
Chr Start End Ref Altchr2 47601106 47601106 T C
2.一组panel 目的区域数据,如
chr2 47596606 47596755...
3. 根据变异位点的染色体和起始位置判点是否落在panel 的范围。
解决方案
思路1 :
通过 pandas DataFrame 筛选符合条件的数据,详细描述:
1. 读取panel 文件,另存数据框;
2. 读取变异位点数据,另存数据框。并对数据每一行条件判断处理。通过apply ()函数实现;
3. 条件判断内容:1. 染色体一样, 2变异位点在bed 区域内 panel_start <= und_pos < panel_end.
编程应用知识点:
pandas :
groupby() 分组处理,;
apply() 整行或整列处理, 可以输出外部参数;map 也是 整行或整列处理;
namedtuple:生成元组;
yield : 函数生成器, 调用该函数返回对象,很好的做法,减少内存开销.
实现:
( distinctions ) github : https://github.com/JinYang-Law/bioScript.git
文章转载自罗大黑学生信,如果涉嫌侵权,请发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。




