鱼C论坛

 找回密码
 立即注册
查看: 2090|回复: 7

请问怎么将一个区间分为若干个小区间

[复制链接]
发表于 2019-6-12 17:07:46 | 显示全部楼层 |阅读模式

马上注册,结交更多好友,享用更多功能^_^

您需要 登录 才可以下载或查看,没有账号?立即注册

x
有一个数据框(20多行,3列)
Chr        Start        End
1        0        248956422
2        0        242193529
3        0        198295559
4        0        190214555

现在我想把每一行的start-end划分为若干个区间,窗口长度定为1000000,比如说第一行就变成了:
1        0        1000000
1        1000000        2000000
........
........
以此类推,请问一下有什么方法能够快速达到这个目的的吗?我的想法是写一个函数循环,但是感觉循环特别耗费时间
小甲鱼最新课程 -> https://ilovefishc.com
回复

使用道具 举报

发表于 2019-6-12 18:21:39 | 显示全部楼层
pandas中有个cut方法,不知道是不是你要的方法。。
这个是用来将连续变量分箱化的处理方式。。
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2019-6-12 20:10:50 | 显示全部楼层
老笨啊 发表于 2019-6-12 18:21
pandas中有个cut方法,不知道是不是你要的方法。。
这个是用来将连续变量分箱化的处理方式。。

你觉得整出来是啥效果,写写代码看看
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2019-6-12 21:23:45 | 显示全部楼层
题主不会是搞生信的吧,哈哈。
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2019-6-12 22:08:34 | 显示全部楼层
表示没看懂,你要这样分割不用循环怎么分割?

或者你如果想先整体分割好再用的话可以用generator。show me the code

  1. def read_in_chunks(data_object, chunk_size=100000):
  2.     while True:
  3.         data = data_object.read(chunk_size)
  4.         if not data:
  5.             break
  6.         yield data
复制代码
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2019-6-17 17:33:29 | 显示全部楼层
已解决
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2019-6-17 17:35:17 | 显示全部楼层

嗯,你怎么解决的
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2020-6-9 10:49:27 | 显示全部楼层
请问楼主怎么解决的
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Archiver|鱼C工作室 ( 粤ICP备18085999号-1 | 粤公网安备 44051102000585号)

GMT+8, 2025-6-21 14:53

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表