添加
我遇到了一个问题,我必须向学习函数创建的标记计数列表中添加一个附加功能(平均字长)。 假设我有以下代码:
#列表
文本 = [(列表)]
#每条推文的单词列表
= ()
#
= ( = '单词', = (1,1))
= .(文本)
每个实例的格式应该是(令牌,平均字长)。 我最初的想法是使用 zip 函数简单地连接两个列表,如下所示:
x = zip(, )
但是当我尝试拟合我的模型时,出现错误:
:一个带有 .
有谁知道如何解决这一问题?
您可以像本文一样编写自己的转换器,它将为您提供每条推文的平均字长并使用:
=([
('简历', ( = '单词', = (1,1))),
('',(…))
])
由于返回的是稀疏矩阵,因此需要对其进行稀疏矩阵运算。 您可以使用 scipy 来做到这一点。
这样做
例如(取自 scipy 的文档):
来自 scipy. ,
A = ([[1, 2], [3, 4]])
B = ([[5], [6]])
([A,B]).()
数组([[1,2,5],
[3,4,6]])
好了,今天的主题就讲到这里吧,不管如何,能帮到你我就很开心了,如果您觉得这篇文章写得不错,欢迎点赞和分享给身边的朋友。
声明:本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。