添加

我遇到了一个问题,我必须向学习函数创建的标记计数列表中添加一个附加功能(平均字长)。 假设我有以下代码:

#列表

文本 = [(列表)]

#每条推文的单词列表

= ()

#

= ( = '单词', = (1,1))

= .(文本)

每个实例的格式应该是(令牌,平均字长)。 我最初的想法是使用 zip 函数简单地连接两个列表,如下所示:

x = zip(, )

但是当我尝试拟合我的模型时,出现错误:

:一个带有 .

有谁知道如何解决这一问题?

您可以像本文一样编写自己的转换器,它将为您提供每条推文的平均字长并使用:

=([

('简历', ( = '单词', = (1,1))),

('',(…))

])

由于返回的是稀疏矩阵,因此需要对其进行稀疏矩阵运算。 您可以使用 scipy 来做到这一点。

这样做

例如(取自 scipy 的文档):

来自 scipy. ,

A = ([[1, 2], [3, 4]])

B = ([[5], [6]])

([A,B]).()

数组([[1,2,5],

[3,4,6]])

好了,今天的主题就讲到这里吧,不管如何,能帮到你我就很开心了,如果您觉得这篇文章写得不错,欢迎点赞和分享给身边的朋友。

发表回复

您的电子邮箱地址不会被公开。 必填项已用*标注