900字范文,内容丰富有趣,生活中的好帮手!
900字范文 > tf算法 – CSS – 前端 display 属性 css3

tf算法 – CSS – 前端 display 属性 css3

时间:2022-12-24 08:38:14

相关推荐

tf算法 – CSS – 前端 display 属性 css3

from sklearn.feature_extraction.text import CountVectorizer

from sklearn.feature_extraction.text import TfidfTransformer

x_train = [ f-idf 主要 思想 是,算法 一个 重要 特点 可以 脱离 语料库 背景,

如果 一个 网页 被 很多 其他 网页 链接 说明 网页 重要]

x_test=[原始 文本 进行 标记,主要 思想]

#该类会将文本中的词语转换为词频矩阵,矩阵元素a[i][j] 表示j词在i类文本下的词频

vectorizer = CountVectorizer(max_features=10)

#该类会统计每个词语的tf-idf权值

tf_idf_transformer = TfidfTransformer()

#将文本转为词频矩阵并计算tf-idf

tf_idf = tf_idf_transformer.fit_transform(vectorizer.fit_transform(x_train))

#将tf-idf矩阵抽取出来,元素a[i][j]表示j词在i类文本中的tf-idf权重

x_train_weight = tf_idf.toarray()

#对测试集进行tf-idf权重计算

tf_idf = tf_idf_transformer.transform(vectorizer.transform(x_test))

x_test_weight = tf_idf.toarray() # 测试集TF-IDF权重矩阵

print(输出x_train文本向量:)

print(x_train_weight)

本内容不代表本网观点和政治立场,如有侵犯你的权益请联系我们处理。
网友评论
网友评论仅供其表达个人看法,并不表明网站立场。