暂无图片
暂无图片
暂无图片
暂无图片
暂无图片

判断变异位点是否存在panel

罗大黑学生信 2021-11-10
364

问题:判断变异位点是否存在panel

详细描述:

1. 一组变异位点数据,如

Chr     Start   End     Ref     Alt 
chr2 47601106 47601106 T C


2.一组panel 目的区域数据,如

chr2  47596606  47596755
...


3. 根据变异位点的染色体和起始位置判点是否落在panel 的范围。


解决方案

思路1 :

通过 pandas  DataFrame 筛选符合条件的数据,详细描述:

1. 读取panel 文件,另存数据框;

2. 读取变异位点数据,另存数据框。并对数据每一行条件判断处理。通过apply ()函数实现;

3. 条件判断内容:1. 染色体一样, 2变异位点在bed 区域内 panel_start <= und_pos < panel_end.


编程应用知识点:

pandas :

groupby()  分组处理,;

apply() 整行或整列处理, 可以输出外部参数;map 也是 整行或整列处理;

namedtuple:生成元组;

yield : 函数生成器, 调用该函数返回对象,很好的做法,减少内存开销.


实现:

( distinctions )  github : https://github.com/JinYang-Law/bioScript.git


                                               



文章转载自罗大黑学生信,如果涉嫌侵权,请发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。

评论