我有一个如下文件:
chr19 61336212 + 0 0 CG CGT
chr19 61336213 - 0 0 CG CGG
chr19 61336218 + 0 0 CG CGG
chr19 61336219 - 0 0 CG CGC
chr19 61336268 + 0 0 CG CGG
chr19 61336269 - 0 0 CG CGA
chr19 61336402 + 0 0 CG CGG
chr19 61336403 - 0 0 CG CGT
我想在第二个字段的每10000个间隔(不行,但数字间隔)中分割此文件。因此,对于此文件,我想从第一行(具有61336212的行)拆分为具有或最多61346211(61336212 + 9999)的行,然后从61346212扩展至61356211,依此类推。如您所见,第二个字段/列中的数字未“填充”。
有没有办法做到这一点?
在您的示例中,如果在61346211之后的下一个数字是61346220,例如,您是否希望输出的第二个文件覆盖从61346212或61346220开始的范围?
—
Joe Lee-Moyet 2015年
第二范围应覆盖从61346212.
—
agathusia