中文字符转为相关张量 机器学习
基于keras的机器学习只能接受数据,无法接受中文字符已有中文字符numpy.array()类型,例如['北京','上海','北京','深圳','南京']等
请问该如何将上述字符串的中文字符转为张量,以此输入到神经网络中
这些字符串要参与数学运算吗? 本帖最后由 jackz007 于 2021-12-8 14:38 编辑
变成字节码可以不?
import numpy
a = numpy . array(('中国' , '日本' , '韩国'))
print(a)
b =
print(b)
c =
print(c)
运行实况:
D:\0002.Exercise\Python>python x.py
['中国' '日本' '韩国']
['中国', '日本', '韩国']
D:\0002.Exercise\Python>
b 就是把 a 中的文字符串按 'GBK' 编码后得到的字节码列表。 jackz007 发表于 2021-12-8 14:34
变成字节码可以不?
运行实况:
感谢,我自己找到了另一种,也可以试试。就是pandas库的Category(),这俩个都挺好使
页:
[1]