用Python为外语(希伯来语)创建词云
我想创建一个WordCloud. 当我的字符串用英语时,一切都很好: from wordcloud import WordCloud from matplotlib import pyplot as plt text="""Softrock 40 - close to the 6 MHz that the P6D requires (6.062 according) - https://groups.yahoo.com/neo/groups/softrock40/conversations/messages I want the USB model that has a controllable (not fixed) central frequency.""" wordcloud = WordCloud().generate(text) plt.imshow(wordcloud, interpolation='bilinear') plt.axis("off") plt.show
0 2024-01-22
编程技术问答社区
闪亮和 twitter 示例
我正在尝试运行一个示例,以在R中处理R中的Tweets.我正在使用这个页面,但我没有得到任何输出. 我正在使用的代码如下(我从页面上进行了纠正,因为它在括号,倒置昏迷等方面存在一些错误): ui.r library(shiny) shinyUI(pageWithSidebar( # Application title headerPanel('Tweets hunter'), sidebarPanel( textInput('term', 'Enter a term', ''), numericInput('cant', 'Select a number of tweets',1,0,200), radioButtons('lang','Select the language',c( 'English'='en', 'Cas
8 2023-10-28
编程技术问答社区
在R中创建Word Cloud时的错误(simple_triplet_matrix中的错误:'i,j,v'不同的长度)
我在R中有以下代码,以获取有关本地市长候选人的最新推文并创建一个WordCloud: library(twitteR) library(ROAuth) require(RCurl) library(stringr) library(tm) library(ggmap) library(plyr) library(dplyr) library(SnowballC) library(wordcloud) (...) setup_twitter_oauth(...) N = 10000 #Number of twetts S = 200 #200Km radius from Natal (Covers the whole Natal area) candidate = 'Carlos+Eduardo' #Lists so I can add more cities in future codes lats = c(-5.7792569) lons = c(-35.200916) #
8 2023-10-19
编程技术问答社区
WordCloud在r中显示基于连续元数据的颜色
我正在创建一个单词大小基于频率的wordcloud,但我希望单词的颜色映射到第三个变量(压力,这是与每个单词相关的压力量,数值或连续变量). 我尝试了以下内容,这只给了我两种不同的颜色(黄色和紫色)​​,而我想要更光滑的东西.我想要一些颜色范围,例如从绿色到红色的调色板. df = data.frame(word = c("calling", "meeting", "conference", "contract", "negotiation", "email"), n = c(20, 12, 4, 8, 10, 43), stress = c(23, 30, 15, 40, 35, 15)) df = tbl_df(df) wordcloud(words = df$word, freq = df$n, col = df$stress) 有人知道如何处理这种连续的元数据,并在压力上升时获得一些平稳的变化颜色?谢谢! 解决方案 这是一个潜在的解决方案.您想将word
4 2023-10-19
编程技术问答社区
在r中使所有单词大写
创建WordClouds时,最常见的是使所有单词小写.但是,我希望WordClouds显示大写字样.强迫单词成为大写后,WordCloud仍然显示小写字.有什么想法? 可再现代码: library(tm) library(wordcloud) data
14 2023-10-19
编程技术问答社区
用R中的tm包进行文本挖掘,删除从[http]开始的词或任何其他特定的词。
我是R的新手和文本挖掘.我从与某个术语有关的Twitter提要中制作了一个单词云.我面临的问题是,在WordCloud中显示HTTP:...或htt ... 我该如何处理这个问题 我尝试使用metacharacter *,但我仍然怀疑我是否正确应用它 tw.text = removewords(tw.text,c(stopwords(" en")," rt"," http \\*")) 有人在短信中,请帮助我. 解决方案 如果您想从字符串中删除URL,则可以使用: gsub("(f|ht)tp(s?)://(.*)[.][a-z]+", "", x) 其中x将是: x clean_x
6 2023-10-19
编程技术问答社区
具有特定形状的词云
假设,我有一个数据框,其中包含一些频率的单词.我想在r中创建一个wordcloud,并在徽标的形状中使用单词,例如,Twitter徽标就是这样: 对于WordCloud,有一个名为wordcloud2的软件包,并且运行演示仅给出单词的正方形图像.我如何添加我选择的特定图像以成为WordCloud的形状? wordcloud2(demoFreq)只有一个正方形. 解决方案 您可以使用wordcloud2软件包.它允许您将任何图像用作掩模.只需使用figpath放入工作目录并链接到它.以下是我用来制作WordCloud的代码.下面是WordCloud. 在这里是我用作口罩的图像. library(wordcloud2) wordcloud2(demoFreq, figPath = "twitter.jpg")
8 2023-10-19
编程技术问答社区
如何计算teradata中的单词频率
例如,如果我有1000行数据的数据(例如123)及其对我们产品的评论(例如,出色的产品易于使用) 我如何使用teradata(15版)进行单词频率计数,以便输出具有两个单词的列,另一个带有频率. (伟大:20,产品:10)? 谢谢 解决方案 您可以使用strtok_split_to_table来实现此操作. 类似以下内容: SELECT d.token, SUM(d.outkey) FROM TABLE (strtok_split_to_table(1, ., ' ') RETURNS (outkey integer, tokennum integer, token varchar(20)character set unicode) ) as d GROUP BY 1 这将使您的注释字段中的每个单词分为单个记录,然后计算每个单词的出现.只需将自己的.
2 2023-10-17
编程技术问答社区
如何创建一个简单的标签云?使用C#和用css进行样式设计
我发现无法创建标签云,我找不到任何演练或教程. (至少有效的人). 我只是在寻找一个工作标签云的简单,基本的示例,之后我可以给它调味. 我发现的最好的链接是: ,但它已经过时了,我无法下载源文件,并且代码中有很多差距. 解决方案 这不是一个很难的问题.本质上,标签云只是将字体大小链接到标签的常见方式的一种方式. 第一件事是标签出现多久: select Value, Count(*) from Tag group by Value order by Count(*) 然后,当您将此结果集渲染到页面上时,具有某种算法来对每个标签进行计数并表示为字体大小.一种天真的方法是将字体直接设置为计数,但这可能会导致不可读的结果.取而代之的是,也许只有前10%作为大字体,接下来的10%作为下一个字体降低等. 此外,从几个角度来看,标签云确实有些垃圾(可读性,搜索,可访问性).确保标签云不是访问标签的唯一方法.也许按alpha顺序或专用页面上的计数(*).
4 2023-10-14
编程技术问答社区
如何用Java生成标签云,用OpenCloud?
我正在寻找一个在Java应用程序中创建标签云的库,我发现 opencloud "> opencloud . 我不想使用opencloud需要的Web服务器来获取输出,不是吗?有没有办法让OpenCloud在Java/Swing面板中工作?我想要一个独立应用的东西.如果不可能,我还能在哪里寻找这样的API? 解决方案 实际上OpenCloud不需要Web服务器.只需使用Swing渲染而不是HTML/JSP.这是一个小片段,说明了使用OpenCloud库的非常基本的秋千标签云.它可以改进,但它为您提供了要点: import java.util.Random; import javax.swing.JFrame; import javax.swing.JLabel; import javax.swing.JPanel; import javax.swing.SwingUtilities; import org.mcavallo.opencloud.Cloud; import
6 2023-10-14
编程技术问答社区
d3.js单词在单词云中丢失
js并尝试在[此处]: layout = d3.layout.cloud().size([w, h]) .words(frequency_list) .padding(5) .rotate(function() { return ~~(Math.random() * 2) * 90; }) .font(d3.select("#font").property("value")) .fontSize(function(d) { return (d.freq*wordSize); }) .spiral(d3.select("input[name=spiral]:checked").property("value")) .on("end",draw) .start(); 我想到的是获得元素的宽度和高度,然后相应地调整单词大小,但似乎我无法使用[d3.layout.cloud.js]做到这一点: 解决方案 最好在10
6 2023-10-06
编程技术问答社区
如何从 wordcloud R 软件包中删除单词,以便将其包含在输出中?
我正在使用r packages存储库中的" wordcloud"与描述" word cloud"的软件包.当我从某些随机文本中创建WordCloud时,会自动省略某些单词,因为它们不应该成为WordCloud的一部分. 代码: library(RColorBrewer) library(NLP) library(wordcloud) library(tm) wordcloud("foo bar oh oh by by bye bingo hell no", scale=c(3,1), colors=brewer.pal(6,"Dark2"),random.order=FALSE) 输出: 我想在WordCloud中保留" OH"和" by"之类的单词.如何? 编辑:我更喜欢从WordCloud软件包中删除一组stopwords的这些单词,而不是使用频率. 解决方案 这是一种方法: library(wordcloud) library(tm)
8 2023-08-21
编程技术问答社区
使用 python 创建 n-grams 词语云
我正在尝试使用Bi-gram生成单词云.我能够生成前30个歧视单词,但在绘制时无法一起显示单词.我的单词云图像看起来仍然像一个Uni-gram云.我已经使用了以下脚本和Sci-kit学习软件包. def create_wordcloud(pipeline): """ Create word cloud with top 30 discriminative words for each category """ class_labels = numpy.array(['Arts','Music','News','Politics','Science','Sports','Technology']) feature_names =pipeline.named_steps['vectorizer'].get_feature_names() word_text=[] for i, class_label in enumerate(class_labels): top30
146 2023-08-21
编程技术问答社区
word cloud -Error in strwidth(words[i], cex = size[i], ...) : invalid 'cex' value
我正在复制 strwidth中的错误(单词[i],cex = size [i],...):无效的'cex'值 另外:警告消息: 1:在最大(弗雷克)中:没有对最大的无误论点;返回-inf 2:在最大(FREQ)中:没有对最大的无误论点;返回-inf 我不太了解代码的每个步骤中发生了什么,但是我认为问题可能与产生不同行或列的矩阵有关.这是我正在使用的代码: install.packages(c("devtools", "rjson", "bit64", "httr")) library(devtools) install_github("twitteR", username="geoffjentry") library(twitteR) ## api_key= "xxxxxx" api_secret= "xxxxxx" access_token="xxxxxxxxxxxx" access_token_secret= "xxxxxx" setup_twitter_oauth(
8 2023-07-27
编程技术问答社区
用 R 从词云中删除单词
我能够制作单词云,但我的问题是当我接受单词计数的频率时,我会得到一个频率为1的单词.我想要频率大于2的单词.我该怎么做? tdm只是一个术语矩阵.我尝试了rowSums(m>2)之类的东西,但它不起作用 # define tdm as matrix m = as.matrix(tdm) # get word counts in decreasing order word_freqs = sort(rowSums(m), decreasing=TRUE) # create a data frame with words and their frequencies dm = data.frame(word=names(word_freqs), freq=word_freqs) 尝试从 解决方案 您可以在构造数据之前简单地过滤word_freqs: word_freqs 2]
6 2023-07-27
编程技术问答社区
R 语言中的词云,有两个独立的值
作为R的新手,我正在生产一个单词云,显示两个变量:frequency和rating.使用一张通用表,我希望按州显示假设的大学(字体=大到小)和假设的大学评级 1 =绿色(良好), 3 =黄色(平均), 5 =红色(坏) 我能够创建描绘字体=大学数量的云,但不能将评级与第三列息息相关.这是我的通用表: State Colleges Rating Alabama 220 1 Alaska 100 3 Arizona 50 5 Arkansas 275 1 California 155 3 Colorado 68 5 Connecticut 235 1 Delaware 189 3 Florida 32 5 Georgia 219 1 H
2 2023-07-27
编程技术问答社区
R {wordcloud}软件包中的刻度值代表什么?
这似乎是一个简单的问题,但我似乎在任何地方都找不到答案.在r {wordcloud}软件包中,wordcloud函数,您可以输入一个比例值. The full documentation (here: https://cran.r-project.org/web/packages/wordcloud/wordcloud.pdf) says: "A vector of length 2 indicating the range of the size of the words." 我似乎无法对这些价值观有任何意义,我找不到任何其他文档.例如,示例具有scale=c(4,.5)或scale=c(8,.3).这些数字是什么意思? 我稍微弄乱了不同的值,但是我似乎无法弄清楚该模式. 预先感谢您的任何帮助, 塞思 解决方案 wordcloud内部计算 size
32 2023-07-27
编程技术问答社区
r wordcloud 外部 ttf vfont 无法识别
I've installed the 'extrafont' package in order to install an external font library Duality via the ttf_import() method.但是,当通过WordCloud方法指定字体时,我会收到以下错误: 安装命令: # Assuming the font file, DUALITY_.ttf, is in the working directory (see link to font above) font_import(".",FALSE,pattern="DUALITY") WordCloud命令: wordcloud(ap.d$word, ap.d$freq, scale=c(8,2), min.freq=10, vfont=c("Duality","plain"), random.order=FALSE, rot.per=0, use.r.lay
42 2023-07-27
编程技术问答社区