鱼C论坛

 找回密码
 立即注册
查看: 1170|回复: 3

[已解决]中文字符转为相关张量 机器学习

[复制链接]
发表于 2021-12-8 12:27:15 | 显示全部楼层 |阅读模式

马上注册,结交更多好友,享用更多功能^_^

您需要 登录 才可以下载或查看,没有账号?立即注册

x
基于keras的机器学习只能接受数据,无法接受中文字符

已有中文字符numpy.array()类型,例如['北京','上海','北京','深圳','南京']等

请问该如何将上述字符串的中文字符转为张量,以此输入到神经网络中
最佳答案
2021-12-8 14:34:25
本帖最后由 jackz007 于 2021-12-8 14:38 编辑

        变成字节码可以不?
import numpy
a = numpy . array(('中国' , '日本' , '韩国'))
print(a)
b = [x . encode('GBK') for x in a]
print(b)
c = [x . decode('GBK') for x in b]
print(c)
        运行实况:
D:\0002.Exercise\Python>python x.py
['中国' '日本' '韩国']
[b'\xd6\xd0\xb9\xfa', b'\xc8\xd5\xb1\xbe', b'\xba\xab\xb9\xfa']
['中国', '日本', '韩国']

D:\0002.Exercise\Python>
        b 就是把 a 中的文字符串按 'GBK' 编码后得到的字节码列表。
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

发表于 2021-12-8 12:43:52 | 显示全部楼层
这些字符串要参与数学运算吗?
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2021-12-8 14:34:25 | 显示全部楼层    本楼为最佳答案   
本帖最后由 jackz007 于 2021-12-8 14:38 编辑

        变成字节码可以不?
import numpy
a = numpy . array(('中国' , '日本' , '韩国'))
print(a)
b = [x . encode('GBK') for x in a]
print(b)
c = [x . decode('GBK') for x in b]
print(c)
        运行实况:
D:\0002.Exercise\Python>python x.py
['中国' '日本' '韩国']
[b'\xd6\xd0\xb9\xfa', b'\xc8\xd5\xb1\xbe', b'\xba\xab\xb9\xfa']
['中国', '日本', '韩国']

D:\0002.Exercise\Python>
        b 就是把 a 中的文字符串按 'GBK' 编码后得到的字节码列表。
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2021-12-9 08:35:19 | 显示全部楼层
jackz007 发表于 2021-12-8 14:34
变成字节码可以不?

        运行实况:

感谢,我自己找到了另一种,也可以试试。就是pandas库的Category(),这俩个都挺好使
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Archiver|鱼C工作室 ( 粤ICP备18085999号-1 | 粤公网安备 44051102000585号)

GMT+8, 2025-1-12 16:07

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表