鱼C论坛

 找回密码
 立即注册
查看: 1839|回复: 7

请问怎么将一个区间分为若干个小区间

[复制链接]
发表于 2019-6-12 17:07:46 | 显示全部楼层 |阅读模式

马上注册,结交更多好友,享用更多功能^_^

您需要 登录 才可以下载或查看,没有账号?立即注册

x
有一个数据框(20多行,3列)
Chr        Start        End
1        0        248956422
2        0        242193529
3        0        198295559
4        0        190214555

现在我想把每一行的start-end划分为若干个区间,窗口长度定为1000000,比如说第一行就变成了:
1        0        1000000
1        1000000        2000000
........
........
以此类推,请问一下有什么方法能够快速达到这个目的的吗?我的想法是写一个函数循环,但是感觉循环特别耗费时间
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

发表于 2019-6-12 18:21:39 | 显示全部楼层
pandas中有个cut方法,不知道是不是你要的方法。。
这个是用来将连续变量分箱化的处理方式。。
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2019-6-12 20:10:50 | 显示全部楼层
老笨啊 发表于 2019-6-12 18:21
pandas中有个cut方法,不知道是不是你要的方法。。
这个是用来将连续变量分箱化的处理方式。。

你觉得整出来是啥效果,写写代码看看
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2019-6-12 21:23:45 | 显示全部楼层
题主不会是搞生信的吧,哈哈。
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2019-6-12 22:08:34 | 显示全部楼层
表示没看懂,你要这样分割不用循环怎么分割?

或者你如果想先整体分割好再用的话可以用generator。show me the code
def read_in_chunks(data_object, chunk_size=100000):
    while True:
        data = data_object.read(chunk_size)
        if not data:
            break
        yield data
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2019-6-17 17:33:29 | 显示全部楼层
已解决
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2019-6-17 17:35:17 | 显示全部楼层

嗯,你怎么解决的
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2020-6-9 10:49:27 | 显示全部楼层
请问楼主怎么解决的
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Archiver|鱼C工作室 ( 粤ICP备18085999号-1 | 粤公网安备 44051102000585号)

GMT+8, 2025-1-20 19:17

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表