Java,Ant错误:编码Cp1252的不可应用字符
我在项目中使用Java,Eclipse和Ant.我有一些Java代码需要编辑并在其中添加一些UTF-8字符.以前我的build.xml有: 而且效果很好.现在,在我尝试运行时添加了这些UTF-8字符后,它会引发"错误:用于编码CP1252" 的不适合字符 有人可以告诉我什么是修复?我尝试将编码更改为XML中的UTF-8和CP1252,但没有运气. 我正在使用JRE7,Eclipse Kepler和Ant 4.11. 解决方案 这可能很棘手,简单地更改"广告"编码并不能弥补文件中的字节在使用UTF-8解释中无法理解的字节.在ANT中,您需要更新javac任务以添加一个编码,例如 确保在Eclipse中编码的文件也是UTF-8,因为某些CP1252字符也不直接映射到UTF-8中.您可能需要使用单个编码来维护整个项目.否则,当编译器仅期望一个编译器时,将看到不同的编码. 其他解决方案 您可以尝试将称为ant
4 2024-02-26
编程技术问答社区
在对使用 IDLE 编辑的 Python 代码执行保存时,如何处理非 ASCII 警告?
我经常使用空闲编辑Python代码,偶尔在执行保存时会收到I/O警告. 我假设我已经无意中添加了一个非ASCII角色,并且我真的不想声明CP1252编码. 是否有一种简单的方法来查找和删除警告与? 有关的非ASCII 涉及的OS版本是Windows 7,Python版本为2.6.5 解决方案 Regex [^ -~]除了打印ASCII字符外,任何内容都将匹配.它应该能够找到您的流浪非ASCII角色. 与IDLE的搜索对话(CTRL + F,或编辑→查找)一起使用它;它可以通过正则搜索:
8 2023-12-06
编程技术问答社区
为什么我的简化DES的实现在Cp1252编码下工作正常,而在UTF-8下却不正常?
我昨天问了以下问题,但由于我并没有真正包含有关实际问题的任何细节,但没有得到太多关注. eclipse "> eclipse :使用文本编辑器中编码的UTF-8使字符串无法正常工作,我该如何解决? 我将尝试尽可能多地分析我的问题,以便您清楚地了解正在发生的事情. 我有一个大学项目,我应该为教育目的实施简化的DES算法.该算法是一种使用10位键的加密算法来加密8位数据. 在实施中,我想包括加密任何字符串. 因此,我编写了用于加密8位的代码,并且对于各种输入而言,它都可以很好地工作.为了包括字符串加密支持,我使用了函数String.getBytes(),在变量byte[] data> 中保存了字符串的所有字节 然后我遵循此逻辑: int i; for(i=0; i
6 2023-11-12
编程技术问答社区
我可以在eclipse中安装额外的编码吗?
我有一个问题,我需要使用在Windows下创建(仍在使用)的颠覆存储库.因此,默认编码为CP-1252. 现在,我想在Linux中查看此存储库,并使用Eclipse更改文件.如果可能的话,我不想使用iconv> UTF-8重新编码整个文件,因为我不知道Windows下的程序的表现如何. 我的第一个想法是将编码的项目设置为CP-1252.在我的安装(在Linux下)Eclipse的安装下,编码没有选项CP-125x.只有一些UTF-*和ISO-8859-1是可选的. 有没有办法在Eclipse中安装进一步的编码? 解决方案 "首选项>常规> workspace"页面上的'文本文件编码'字段仅显示下拉列表中最常见的编码.但是,您可以输入其他编码到字段. Java Charset类支持的任何编码都可以接受. Windows" CP-125X"编码被称为" Windows-125x",Charset. 同样适用于文件"属性>资源"页面中显示的文件编码.
4 2023-11-12
编程技术问答社区
Python打开功能应该使用哪种编码?
阅读包含正确的双引号Unicode符号的文件时,我会得到异常.它编码在UTF-8(0xE2 0x80 0x9d)中.最小示例: import sys print(sys.getdefaultencoding()) f = open("input.txt", "r") r.readline() 即使正确的引号标记不在第一行,此脚本也会读取第一行.例外看起来像: Traceback (most recent call last): File "", line 1, in File "C:\Program Files\Python36\lib\encodings\cp1252.py", line 23, in decode return codecs.charmap_decode(input,self.errors,decoding_table)[0] UnicodeDecodeError: 'charmap' codec c
6 2023-11-12
编程技术问答社区
blob,转换为8位cp1251或cp1252
我需要使用Blob 编码UTF到8位CP1251或CP1252的解决方案 我设法改变了 https://github.com/b4stien/js-csv-encoding 包括Windows 1251 ,但是有不溶性的问题: 不幸的是,NoScript不允许在页面上加载外部JavaScript,并通过IT关闭脚本. 因此,在书签器中使用JS-CSV编码以及加载JQuery是不可能的!禁用NoScript,尤其是在Meltdown和Spectre根本不安全之后. 因此,仅保留用本机JavaScript编写的小脚本的版本. 如果您找到一种与NoScript Off一起运行jQuery的替代方法,那么我怀疑可能会更容易找到解决方案. 一个好的解决方案是 function download(text, name, type
10 2023-11-12
编程技术问答社区
编码CP1252字符串到C#中的UTF-8字符串
如何将CP1252字符串转换为C#中的UTF-8字符串? 我尝试了此代码,但它不起作用: Encoding wind1252 = Encoding.GetEncoding(1252); Encoding utf8 = Encoding.GetEncoding(1251); byte[] wind1252Bytes = ReadFile(myString1252); byte[] utf8Bytes = Encoding.Convert(wind1252, utf8, wind1252Bytes); string myStringUtf8 = Encoding.UTF8.GetString(utf8Bytes); 解决方案 var myGoodString = System.IO.File.ReadAllText( @"C:\path\to\file.txt", Encoding.GetEncoding("Windows-1252") ); a .n
12 2023-11-12
编程技术问答社区
用于UTF8到1252的Windows C API
我熟悉widechartomultibyte和MultibyTetoWideChar的转换,可以使用这些转换来做: utf8-> utf16-> 1252 我知道ICONV会做我需要的事情,但是有人知道有任何MS LIB可以在一个呼叫中允许这一点吗? 我可能应该只是拉到iConv库,但是很懒惰. 谢谢 解决方案 Windows 1252主要等于Latin-1,又名ISO-8859-1:Windows-1252仅在拉丁语1保留范围128-159中分配了一些其他字符.如果您准备忽略这些额外的角色,而坚持拉丁1,那么转换非常容易.尝试以下操作: #include /* * Convert from UTF-8 to latin-1. Invalid encodings, and encodings of * code points beyond 255, are replaced by question marks. No
8 2023-11-12
编程技术问答社区
在javascript中把cp1252转换为unicode
我需要将CP125* 2**在JavaScript函数中转换为Unicode UTF. 将CP125* 1 *转换为UTF的功能. 如果您有此功能,请帮助我,谢谢! 解决方案 如果ISO-8859-1足够近,则有一个特殊的快捷方式可以将ISO-8859-1-1- bytes-in-code-units转换为Unicode字符,因为简单的字节=代码点映射: var chars= decodeURIComponent(escape(bytes)); 对于任何其他编码都没有内置功能;您必须包括自己的查找表.例如: var encodings= { // Windows code page 1252 Western European // cp1252: '\x00\x01\x02\x03\x04\x05\x06\x07\x08\t\n\x0b\x0c\r\x0e\x0f\x10\x11\x12\x13\x14\x15\x16\x17\
10 2023-11-12
编程技术问答社区
为什么我不能将 \xDF (ß) 解码为 UTF-8?
我有一个bytestring b"\xDF".当我尝试将其解码为UTF-8时,抛出了 unicodeDecodeError .解码为CP1252工作正常.在两个charset中,0xDF由字符"ß"表示.那么为什么错误? >>> hex(ord("ß")) '0xdf' >>> b"\xDF".decode("utf-8") Traceback (most recent call last): File "", line 1, in UnicodeDecodeError: 'utf-8' codec can't decode byte 0xdf in position 0: unexpected end of data >>> b"\xDF".decode("cp1252") 'ß' 解决方案 UTF-8中的所有单字节编码字符都必须在[0x00 .. 0x7f]范围内( https://en.wikipedia.org/wiki/utf-8
2 2023-11-12
编程技术问答社区
在Windows中批量转换cp1252到utf | 8
所以, 我一直在尝试将一个大的Java源树从CP1252转换为Windows中的UTF-8,使用我在线找到的提示和Trix,具体来说在这里.问题是,我在Windows上;我不做VB; Cygwin的Iconv不使用-o开关. 我首次尝试使用的行是: find . -type f -print -exec iconv -f cp1252 -t utf-8 {} > {}.converted \; -exec mv {}.converted {} \; 这将在工作目录中创建文件{}.converted,而第二个-exec出于明显的原因失败. 围绕ICONV表达式列出引号: find . -type f -print -exec 'iconv -f cp1252 -t utf-8 {} > {}.converted' \; -exec mv {}.converted {} \; 在福特错误中弥补: find: `iconv -f cp1252 -t utf
36 2023-11-11
编程技术问答社区
在python中正确读取Windows-1252(cp1252)文件中的文本
好吧,正如标题所示的那样,我遇到的问题是在python中正确读取输入的输入,然后将上述输入插入sqlalchemy-mysql表中. 当前系统设置: Windows 7 VM带有输出文件的" Roger访问控制系统"; Ubuntu 12.04 LTS VM,带有一个共享装备器的Windows系统,因此我可以使用" Python 2.7.3". 现在解决实际问题,对于输入文件,我有一个" vm共享文件",该文件包含一个通过Roger访问控制系统在Windows 7系统上的文件(Roger.pl,有关更多详细信息),此文件称为" precontes.csv",它建议其内容,a;;分开的数据列表. 数据的示例格式: 2013-03-19;15:58:30;100;Jānis;Dumburs;1;Uznemums1;0;Ieeja; 2013-03-19;15:58:40;100;Jānis;Dumburs;1;Uznemums1;2;Izeja; 第四字段包含
14 2023-11-11
编程技术问答社区
为什么Eclipse使用Cp1252编码?
很抱歉,如果这是一个非常业余的问题!我知道Eclipse使用CP1252作为其编码的默认值. 我最近使用哈希地图创建了一个程序,将字母输入转换为盲文.为此,我必须将编码方法更改为UTF-8. 我对此一无所知,但是我阅读的所有内容表明UTF-8可以代表Unicode中的每个字符,并且具有更大的识别符号库. 为什么不是Eclipse的首选编码样式? 解决方案 当您针对全新的工作区启动日食时,Eclipse必须决定在处理某些基于文本的文件时使用哪种编码,默认情况下使用:文本文件,Java源文件,JSP文件,XML和所以. 默认情况下,Eclipse使用默认平台编码,该平台是从操作系统的设置中得出的. 至于为什么UTF-8不是文本文件的默认编码,原因是,在世界范围内,仍然有大量的纯文本文件UTF-8不向后兼容.尽管UTF-8与大多数西部编码兼容,但其他编码并非如此. 您可以通过修改工作区的设置来更改这些默认编码.但是请记住,这些设置存储在工作区级别;如果您
18 2023-11-11
编程技术问答社区
Eclipse:在文本编辑器中使用UTF-8编码会使字符串不能正常工作,如何才能解决这个问题?
我在代码中有一些希腊评论,当我输入希腊字母时,它说"拯救我们UTF-8" 然后,如果我这样做并运行程序,则先前显示的字符串无法正常工作. 例如,我正在使用加密算法(简化的DES),这是我用文本编辑器中的CP1252所获得的,作为输出: ÅO [áa[aá»j×jt INFO BOB 57674 第一行是加密版本,第二行是解密版本 这就是我将编码更改为UTF-8 时得到的 �O [�a[a�j�jt ���NFO���BOB���7���74 我不明白这里发生了什么,我以前从未见过这样的事情.有人能帮我吗?预先感谢您 解决方案 (至少)在这里进行了一次讨论,https://stackoverflow.com/questions/2178348/should-source-source-code-be-be-saved-in-in--saved-in-in--------8--格式">应将源代码保存在UTF-8格式中. 是否应保存. 就个人而言,
8 2023-11-11
编程技术问答社区
如何用JAVA-ANDROID将UTF字符串转换为ANSI并在ExternalSD中创建一个ANSI文本文件
我在Java中写了一个Android应用程序来获取用户答案并将其保存在文件中. 问题是该文件保存在UTF-8中. 最终用户将在IBM SPSS中打开这些文件,windows的应用程序只能在ANSI(Windows-1252)中读取文件. 如何在ANSI代码中创建文件以保存在Java-Android应用中的SD卡中? 我想我知道要将字符串转换为ANSI,我应该使用: String unicode = new String(asciiBytes, "windows-1252"); 是正确的吗? 保存文件的代码是: File interviewFile = new File(placeOfSDD, fileName); FileWriter writer = new FileWriter(interviewFile, true); writer.append(textBody); writer.flush(); writer.close(); " text
12 2023-11-11
编程技术问答社区
哪些字符不能直接从Cp1252映射到UTF-8?
我已经在几个stackoverflow答案中读到,有些字符从CP1252(又称Windows-1252;它们是一样的,不是吗,不是吗?) -8,例如这里: https://stackoverflow.com/a/a/a/23399926/2018047 有人可以为此提供更多的启示吗?这是否意味着,如果我批处理/质量将源代码从CP1252转换为UTF-8,我将获得一些最终作为垃圾的字符? 解决方案 这就是Windows 1252 CodePage的样子. P> 您可以看到,字节0x81,0x8d,0x8f,0x90,0x9d没有分配给它们的任何东西. 如果您的输入文件包含这些字节,并且您将其视为在Windows 1252编码中,则这些字节将被视为无效字符.在正常情况下,这意味着输入文件不在Windows 1252中. 所有其他字节编码可打印字符或控制字符,所有这些字符均以unicode存在,因此可以在UTF-8中明确编码. 我不知道链接的答案试图要求什么,
10 2023-11-11
编程技术问答社区
将cp-1252编码为utf-8?
我正在尝试编写一个将在Linux服务器上运行的Java应用程序,但它将使用CP-1252作为字符集来处理在旧版Windows机器上生成的文件.无论如何,是否可以将这些文件编码为UTF-8而不是CP-1252,它被生成为? 解决方案 如果文件名和内容是一个问题,那么解决问题的最简单方法是将Linux计算机上的locale设置为基于ISO-8859-1而不是UTF-8的东西.您可以使用locale -a列出可用的地区.例如,如果您有en_US.iso88591,则可以使用: export LANG=en_US.iso88591 这样,Java将使用ISO-8859-1用于文件名,这可能足够好.要运行Java程序,您仍然必须设置file.encoding系统属性: java -Dfile.encoding=cp1252 -cp foo.jar:bar.jar blablabla 如果没有ISO-8859-1语言环境,则可以使用localedef生成一个.安装它需要r
10 2023-11-11
编程技术问答社区
允许在(文件)网络服务器上使用UTF-8编码的文件名?
我正在托管一个小文件服务器,用户可以在这里上传来自世界各地的文档. 由于编码的问题(请参阅其他问题),我问自己是否应该禁止用户上传(另一方面下载)CP1252 CHARSET不支持的文件? 或其他;允许用户在文件名中使用阿拉伯或中文字母上传文档是否有意义? ps:他们一段时间以后下载同一文件(并且应该具有与上传的文件名相同的文件名) 解决方案 您应该使用随机生成的名称将文件存储在磁盘上,或者让文件名基于文件内容的哈希(也适用于重复程序存储).您可以将原始文件名与元数据保存在数据库中,以及有关文件的所有其他元数据(将其上传和类似文件).然后,您使用PHP脚本再次使用该文件,该PHP脚本从HTTP标头中的数据库设置原始文件名.这样您: 不需要担心文件名称或重复 文件系统编码问题 存储重复(如果使用哈希)
8 2023-11-09
编程技术问答社区
如何在Python中把u'uf04a'转换为unicode?
我试图在python中解码u'\ uf04a',因此我可以在没有错误警告的情况下打印它.换句话说,我需要将愚蠢的Microsoft Windows 1252字符转换为实际Unicode html包含异常错误的来源来自这里 http://members.lovingfromadistance.com/showthread.php?12338-having-second-thoughts 通过单击此处 http://www.fileformat.info/info/unicode/char/ch/ch/f04a/index.htm 一个例子看起来像这样: "Oh god please some advice ": out [408]:u'oh上帝,请一些建议\ uf04c' 将这样的线程作为测试的一个示例: thread = u'who are you \uf04a Why you are so harsh to her \uf04c' thread
8 2023-11-06
编程技术问答社区