风雨兴 发表于 2021-12-8 12:27:15

中文字符转为相关张量 机器学习

基于keras的机器学习只能接受数据,无法接受中文字符

已有中文字符numpy.array()类型,例如['北京','上海','北京','深圳','南京']等

请问该如何将上述字符串的中文字符转为张量,以此输入到神经网络中

suchocolate 发表于 2021-12-8 12:43:52

这些字符串要参与数学运算吗?

jackz007 发表于 2021-12-8 14:34:25

本帖最后由 jackz007 于 2021-12-8 14:38 编辑

      变成字节码可以不?
import numpy
a = numpy . array(('中国' , '日本' , '韩国'))
print(a)
b =
print(b)
c =
print(c)
      运行实况:
D:\0002.Exercise\Python>python x.py
['中国' '日本' '韩国']

['中国', '日本', '韩国']

D:\0002.Exercise\Python>
      b 就是把 a 中的文字符串按 'GBK' 编码后得到的字节码列表。

风雨兴 发表于 2021-12-9 08:35:19

jackz007 发表于 2021-12-8 14:34
变成字节码可以不?

      运行实况:


感谢,我自己找到了另一种,也可以试试。就是pandas库的Category(),这俩个都挺好使
页: [1]
查看完整版本: 中文字符转为相关张量 机器学习