从查询字符串中提取中文文本
我需要从ASP.NET Web应用程序中的查询字符串中提取中文字符. 当我尝试它时,我得到了" ????"而不是实际文本.我知道我需要用UTF-8对其进行解码,但它不起作用.我用过: String text = System.Web.HttpUtility.UrlDecode(Request.QueryString["text"], System.Text.Encoding.UTF8); 但我得到了" ???"从操作中返回. 请帮助. 解决方案 有两种情况. 第一个情况您的URL在中文中是真实的,唯一获得它的功能是 request.rawurl (而不是request.querystring [" text"] )来自 request.rawurl 您需要手动从文本中获取中文文本=εληνικασανκινε茅α. 第二案例在发送之前先对URL字符串进行编码.在这种情况下,我使用的代码是 String text = Server.UrlDecod
6 2024-04-21
编程技术问答社区
用JavaScript来替代汉字
我正在构建一个JavaScript数组,具体取决于用户的输入.数组构建正常,但是如果用户进入中文符号,则崩溃.我假设是用户输入中文"或a或a'. 有人可以帮忙吗? 感谢所有的输入 解决方案 来自中国人物的完整范围是什么在Unicode?中,CJK Unicode范围是: 4e00-9fff(common) 3400-4DFF(稀有) f900 -faff(兼容性 - 重复,统一变体,企业角色) 20000-2A6DF(罕见,历史) 2F800-2FA1F(兼容性 - 补充) 由于JS字符串仅支持在FFFF上最大化的UCS-2,因此最后两个范围可能并不引起人们的极大兴趣.因此,如果您要构建JS字符串,则应该能够使用以下内容来过滤汉字: replace(/[\u4e00-\u9fff\u3400-\u4dff\uf900-\ufaff]/g, '') 其他解决方案 您需要使用Unicode替换器. 我认为这将为您提供帮助: qid = 2008
6 2024-04-20
编程技术问答社区
我可以让Console展示中文吗?
我一直想知道是否可以在控制台窗口中显示UTF8或UTF16-中国文本,例如Console.Writeline(中文).目前,它显示为???.是否可以启动支持汉字的游戏机会话? 解决方案 Urxvt,Unicode RXVT,是Xwindow的"控制台",它将显示中文字符.假设您使用的是Windows,则可以在Cygwin或Colinux下使用. 另请参阅 windows命令行中的unicode字符 - 如何? .我还没有弄清楚如何将字体更改为Lucida,但至少CHCP 65001摆脱了问号. 更换控制台字体看起来很复杂: https://superuser.com/questions/5035/如何更改windows-console-font . (更新:通过右键单击Windows控制台内的控制台图标;选择属性;"字体"选项卡;和选定的Lucida.没有帮助,中文字符显示为块). this:其他解决方案 在Cygwin下,以下设置可以启用英语界面,但支持猫,
10 2024-04-18
编程技术问答社区
HEX字符串到中文字符串
我有以下代码可以从十六进制到ASCII. //Hexadecimal to ASCII Convertion private static string hex2ascii(string hexString) { MessageBox.Show(hexString); StringBuilder sb = new StringBuilder(); for (int i = 0; i
10 2024-04-17
编程技术问答社区
在Windows窗体文本框中粘贴汉字是不可能的。
我正在开发Winform应用程序,并且有一个文本框,可以从Google Translator粘贴文本.我对几种语言和印度语言获得了积极的效果,但汉字出现为框. 有什么方法可以克服这一点? 解决方案 您应该使用支持CJK编码的适当的Unicode字体.越好的是" Arial Unicode MS",但可能不存在 OS比安装MS Office的Vista早于Vista.在这种情况下,您可以使用另一种字体,例如" nsimsun". string arialUnicodeFontFace = "Arial Unicode MS"; Font unicodeFont = new Font(arialUnicodeFontFace, fontSize); if (unicodeFont.Name != arialUnicodeFontFace) unicodeFont = new Font("NSimSun", fontSize); yourTextBox.Font
30 2024-04-16
编程技术问答社区
在C#中把善乐字转换为汉乐字,反之亦然
正如它在标题线中所说的那样,我想将Zenkaku字符转换为Hankaku的角色,并在C#中将副VRSA转换为vice-vrsa,但不知道该怎么做.因此,说"ラーメン"对" ラーメン",另一方面. 是否可以根据输入的格式自动确定转换需要采用哪种方式来编写此方法? 解决方案 您可以使用 lcmapstring()本机函数: private const uint LOCALE_SYSTEM_DEFAULT = 0x0800; private const uint LCMAP_HALFWIDTH = 0x00400000; public static string ToHalfWidth(string fullWidth) { StringBuilder sb = new StringBuilder(256); LCMapString(LOCALE_SYSTEM_DEFAULT, LCMAP_HALFWIDTH, fullWidth, -1, sb, sb.Cap
14 2024-04-15
编程技术问答社区
检测字符串中的中日韩字符(C#)。
我正在使用itextSharp来生成一系列PDF,使用open sans作为默认字体.有时,名称会插入PDF的内容中.但是,我的问题是,我需要插入的一些名称包含CJK字符(存储在SQL Server中的NVarchar列中),据我所知,目前不支持CJK字符.我需要继续使用open sans作为默认字体,因此理想情况下,我想尝试检测字符串中的cjk字符在数据库中被抓住,然后在打印这些字符时切换到CJK字体. > . 正则是最好的选择吗?不幸的是,我找不到任何有帮助的正则表达式模式. 事先感谢您的任何帮助! 解决方案 使用itextsharp.text.pdf.fontselector; iTextSharp.text.pdf.FontSelector selector = new iTextSharp.text.pdf.FontSelector(); // add 2 type of font to FontSelector selector.AddFont(o
12 2024-04-15
编程技术问答社区
检测Windows字体大小(100%、125%和150%)。
我创建了一个完美工作的应用程序,直到用户选择125%或150%.它将打破我的申请.后来,我通过检测DPI找到了一种找到字体大小的方法. 这很棒,直到使用中文版本的Windows 7的人开始使用我的应用程序.从中文Windows 7上的整个应用程序中断了.从我可以看出的内容(我无法真正测试它,因为我只有英文版本,并且安装语言包并不会引起问题)中文字符引起了奇怪的DPI,这会破坏我的应用程序. 我当前的代码是这样的: if (dpi.DpiX == 120) // For 125% fonts { // Resize form and set default font to correct problems } else if (dpi.DpiX == 96) // For 100 and 150% fonts { // Resize form and set default font to correct problems } 在Windows 7的英
16 2024-04-11
编程技术问答社区
PHP和C++用于UTF-8编码单元的汉字倒序排列
中文单词的Unicode代码点分别为4f60,597d.我从这个工具中得到的下面的控制台应用程序将打印出你的十六进制字节序列 AS 60:4f:7d:59.如您所见,每个字符的Unicode代码点的相反顺序. 60首先4F,而不是4F,然后是60.为什么这样?谁是正确的?工具或控制台应用程序?还是两者? void printHex (char * buf, char *filename) { FILE *fp; fp=fopen(filename, "w"); if(fp == NULL) return; int len2 = sizeof(buf); int i; char store[10]; for (i = 0; i 0) fprintf(fp,":"); //sprintf(store, ); f
16 2024-04-06
编程技术问答社区
防止/解决方法浏览器将线条之间的" \ n"转换为太空(对于汉字)
将newline转换为空间对于英语来说是有意义的,例如,以下html: This is a sentence. 将新线转换为浏览器中的空间后,我们得到以下内容: This is a sentence. 这对英语有好处,但是对汉字不利,因为我们不使用空间在中文中分开单词.这是一个例子(中文句子的含义是"这是一个句子"): 这是 一句话。 我在Chrome,Safari和IE上得到以下结果... 这是 一句话。 ...但是我想要的是以下内容,没有额外的空间: 这是一句话。 我不知道为什么浏览器不忽略新线,如果当前行的最后一个字符和下一行的第一个字符都是汉字(我认为这更有意义).或者他们提供了这种机制,但需要特殊处理? btw,在VIM中,使用" J"连接行时,如果2行的最后一个字符和第一个字符都是中文字符,则不会添加空间.但是对于英语,将添加一个空间.所以我想VIM为此做了一些特殊的处理. 更新
16 2024-04-03
编程技术问答社区
如何使用Boost Spirit来解析中文(unicode utf-16)?
我的程序不认识中文. 如何利用精神识别中国人? 我使用wstring并将其转换为UTF-16. 这是我的标题文件: #pragma once #define BOOST_SPIRIT_UNICODE #include #include #include #include using namespace std; namespace qi = boost::spirit::qi; namespace ascii = boost::spirit::ascii; typedef pair WordMeaningType; typedef vector WordMeaningsType; typedef pair WordType; typ
14 2024-04-02
编程技术问答社区
将带数字的拼音转换为带音标的拼音
是否有任何脚本,库或程序使用Python或BASH工具(例如awk,perl,sed),可以正确转换编号的拼音(例如 dian4 nao3 )到具有音调标记(例如diànNǎo)的UTF-8拼音? 我找到了以下示例,但是它们需要PHP或C#: [php] 转换为强调的Pinyin? [c#] 任何库带有音调的拼音到拼音的数字? 我也找到了各种在线工具,但是它们无法处理大量的转换. 解决方案 我有一些python 3代码可以执行此操作,而且它很小,可以直接放在答案中. PinyinToneMark = { 0: "aoeiuv\u00fc", 1: "\u0101\u014d\u0113\u012b\u016b\u01d6\u01d6", 2: "\u00e1\u00f3\u00e9\u00ed\u00fa\u01d8\u01d8", 3: "\u01ce\u01d2\u011b\u01d0\u01d4\u01da\u01d
12 2024-03-28
编程技术问答社区
Awk: 中日韩文字有什么问题?#Korean
给定一个.txt文件带有空间分隔单词,例如: But where is Esope the holly Bastard But where is 생 지 옥 이 군 지 옥 이 지 옥 지 我 是 你 的 爸 爸 ! 爸 爸 ! ! ! 你 不 會 的 ! 和 awk函数: cat /pathway/to/your/file.txt | tr ' ' '\n' | sort | uniq -c | awk '{print $2" "$1}' 我在我的控制台中得到以下输出 对韩国单词无效(对英语和中文分离的单词有效) 생 16 Bastard 1 But 2 Esope 1 holly 1 is 2 the 1 where 2 不 1 你 2 我 1 是 1 會 1 爸 4 的 2 如何获得韩语单词? 注意:我实际上有300.000行,接近200万字. 编辑:二手答案: $ awk '{a[$1]++}END{for(k in a)print a[
10 2024-03-22
编程技术问答社区
如何在Javascript中获得日语字符的长度?
我有一个带有shift_jis charset的ASP经典页面.页面头部下的元标记是这样的: 我的页面有一个文本框(txtName),该文本框应仅允许200个字符.我有一个JavaScript函数来验证字符长度,在我的提交按钮的onclick()事件上都称为 if(document.frmPage.txtName.value.length > 200) { alert("You have exceeded the maximum length of 200."); return false; } 问题是,JavaScript无法获得Shift_JIS中编码的日语角色的正确长度.例如,字符测具有8个字符的shift_jis长度,但是JavaScript仅将其识别为一个字符,这可能是因为JavaScript默认使用的Uni
16 2024-03-16
编程技术问答社区
浏览器如何处理 "豆腐 "字符
字符.我正在使用 orbitron font 在我正在创建的混合Cordova/android应用中因为它是紧凑的,并且具有我所追求的干净,未来派的外观.但是,我不久前意识到,轨道子是一种相当有限的字体,其支持比基本的拉丁字符集更重要. 我正要启动Google创建的字体家族的转换,因此不再有豆腐 -tofu -tofu beign beign beign beign beign beign beign beign beign beign beign the术语被印刷作者用来描述空白矩形的术语字体没有合适的字形时出现的框. 将Noto Sans,Noto Sans Naksh(阿拉伯语)和Noto sans cjk(远东)字体家庭纳入我的应用程序中会增加它的大小,因此我决定首先在Windows上的Chrome上进行实验(现在有一段时间Android在其混合应用程序中使用的WebView是从Chrome得出的,因此测试具有相当代表性的. 我的测试标记如下所示.即使轨道子被指
20 2024-03-03
编程技术问答社区
在Applet中显示中文文本
我们有一个可以显示中文文字的小程序.我们正在为其指定字体(arial),在Windows和Mac OSX下都可以正常工作. 但是在Linux上的Firefox中,中文字符被呈现为正方形.有没有办法解决这个问题?请注意,我们不能假设客户端上存在特定字体文件. 解决方案 这是因为Windows和Mac上的Arial都是Unicode字体,但它仅在Linux上具有Latin-1 Charset.在许多Linux发行版中,中国字体是可选的,可能没有中文字体. 一种常见的技术是搜索所有字体,以查看它们中的任何一个都可以显示中文字符.例如, static final Font defaultFont =new Font( "Arial Unicode MS", Font.BOLD, 48 ); static private Font[] allFonts; static final char sampleChineseCharacter = '\u4F60'; //
14 2024-03-02
编程技术问答社区
如何使用POI解析Excel文件中的UTF-8字符
我一直在使用POI成功解析XLS和XLSX文件.但是,我无法从Excel电子表格中正确提取特殊字符,例如中文或日语的UTF-8编码字符.我已经弄清楚了如何从UTF-8编码的CSV或选项卡划界文件中提取数据,但是Excel文件没有运气.谁能帮忙? ( edit: code acdipt from commist ) HSSFSheet sheet = workbook.getSheet(worksheet); HSSFEvaluationWorkbook ewb = HSSFEvaluationWorkbook.create(workbook); while (rowCtr
8 2024-02-29
编程技术问答社区
当系统语言为英语时,显示日本风格的中文字母而不是中国风格的中文字母
我的问题与此相似(在文本视图),但有点不同.提出的解决方案将日本字体嵌入应用程序. ,但我不想在应用程序中嵌入日语字体,因为它会增加应用程序尺寸,我将不得不购买昂贵的字体许可证.似乎Android模拟器(Android 8.1)已经具有日本字体.如何使用它,而不是嵌入字体? 我的意思是,当我将系统语言更改为日语时,就是这样: 但是,当系统语言为英语时,就是这样(请注意第三个和第四个字母): 如果您想知道为什么我想以日语显示它们,我想制作一个日本学习应用程序,因此无论系统语言是什么,它都必须显示日语风格的中文字母. 解决方案 自API 17以来noreferrer"> textview.settextlocale kanji.setTextLocale(Locale.JAPAN);
18 2024-02-11
编程技术问答社区
如何在Textview上显示韩文文本?
我想在文本视图中显示韩语文本.它应该显示适当的韩语语言,而是显示垃圾魅力.有人知道怎么修这个东西吗? 预先感谢. 解决方案 Android使用Unicode字体,因此它可以正常显示韩国字符. 您可以尝试更改项目的文本编码,因为它不是Android问题. 其他解决方案 您需要的是将韩国字体加载到文本视图中,例如八分之一,八分之一,dotum. 这与您的问题类似:显示TextView中的所有Unicode Chars 其他解决方案 您需要一个真正的类型字体(TTF)文件来支持看起来的语言.将韩国字体文件复制并粘贴到您的资产文件夹中,然后尝试此代码. TextView text = (TextView) findViewById(R.id.textView1); Typeface font=Typeface.createFromAsset(activity.getAssets(), "fonts/yourfontname.ttf");
12 2024-02-06
编程技术问答社区
如何转换为韩文首字母
嗨,我正在使用韩国Android应用程序. 在这里,我实现了一个带有字母部分标题的列表视图以显示联系人.我使用字符串类的子字符串方法将首字母作为部分标题.对于韩国的联系,我还使用substring方法进行第一字母.在这里,我需要将韩国姓名缩写为theㄱㄴㅁㅅㅇㅈㅋㅋㅌㅌㅍㅍㅍㅍㅍㅍㅎㅍㅎㅎ我并不真正知道韩国联系列表的哪个首字母与这些韩国缩写相匹配. 所以请帮助我如何做到这一点或让我参考关注... 预先感谢.. 解决方案 我认为,只有一个智能角色就可以使用智能的智慧 - 通常是通过完整的jamo来完成的.但是,我没有理由不应该这样做 - 所以让我们做. 首先,您错过了双名缩写.这些与单打不同,因为它们确实需要不同的钥匙按下(通常是Shift+字符).无论如何,您的首字母列表应为: ㄱㄲㄴㄷㄸㄹㅁㅂㅃㅅㅆㅇㅈㅉㅊㅋㅌㅍㅎ 键入初始字符时需要做的第一件事是获取以该特定初始字母开头的字符范围. 通过查看Windows字符映射,我可以看到第一个字母K
10 2024-02-05
编程技术问答社区