不二不幸福 发表于 2019-6-12 17:07:46

请问怎么将一个区间分为若干个小区间

有一个数据框(20多行,3列)
Chr        Start        End
1        0        248956422
2        0        242193529
3        0        198295559
4        0        190214555

现在我想把每一行的start-end划分为若干个区间,窗口长度定为1000000,比如说第一行就变成了:
1        0        1000000
1        1000000        2000000
........
........
以此类推,请问一下有什么方法能够快速达到这个目的的吗?我的想法是写一个函数循环,但是感觉循环特别耗费时间

老笨啊 发表于 2019-6-12 18:21:39

pandas中有个cut方法,不知道是不是你要的方法。。
这个是用来将连续变量分箱化的处理方式。。

塔利班 发表于 2019-6-12 20:10:50

老笨啊 发表于 2019-6-12 18:21
pandas中有个cut方法,不知道是不是你要的方法。。
这个是用来将连续变量分箱化的处理方式。。

你觉得整出来是啥效果,写写代码看看

大裤衩子 发表于 2019-6-12 21:23:45

题主不会是搞生信的吧,哈哈。

newu 发表于 2019-6-12 22:08:34

表示没看懂,你要这样分割不用循环怎么分割?

或者你如果想先整体分割好再用的话可以用generator。show me the code

def read_in_chunks(data_object, chunk_size=100000):
    while True:
      data = data_object.read(chunk_size)
      if not data:
            break
      yield data

不二不幸福 发表于 2019-6-17 17:33:29

已解决

塔利班 发表于 2019-6-17 17:35:17

不二不幸福 发表于 2019-6-17 17:33
已解决

嗯,你怎么解决的

tutu1 发表于 2020-6-9 10:49:27

请问楼主怎么解决的
页: [1]
查看完整版本: 请问怎么将一个区间分为若干个小区间