为什么这个重词会返回一个错误?
为什么以下评估对true? if(preg_match_all('%.*?.*?.*? %ims', $contents, $x)===FALSE) {...} $contents,使用file_get_contents()从 简化了以解决问题的问题.我实际使用的代码是: if(preg_match( '%Areas of Study: .*? (.*?).*?.*? %ims', $contents, $course_list) ) { if(preg_match_all('%.*?.*?(.*?).*? .*?.*? .*?.*?(.*?).*? .*?
0 2023-06-03
编程技术问答社区
从简单Html Dom-HP中排除不需要的HTML
我正在使用html简单的DOM Parser和PHP来获取网站的标题,描述和图像.我面临的问题是我要获得我不想要的HTML以及如何排除这些HTML标签.以下是解释. 这是正在解析的样品HTML结构. Some text value 1 value 2 value 3 // the div I dont want Some Text 我正在使用以下PHP脚本进行解析, foreach($html->find('div#product_description') as $description) { echo $description->outertext ; echo " "; } 上面的代码用ID
0 2023-06-03
编程技术问答社区
让BeautifulSoup正确解析php标签或忽略它们
我目前需要解析大量.phtml文件,获取特定的HTML标签,然后向其添加自定义数据属性. 我正在使用Python Beautifulsoup来解析整个文档并添加标签,并且此部分工作正常. 问题在于,在视图文件(PHTML)上也有一些标签也可以解析.以下是输入输出的示例 输入 getData('sideBarCoStars', []); if (!$stars) return; $sideBarCoStarsCount = $this->getData('sideBarCoStarsCount'); $title = $this->getData('sideBarCoStarsTitle'); $viewAllUrl = $this->getData('sideBarCoStarsViewAllUrl'); $isDomain = $this->getData('isDomain'); $lazy_load = $lazy
0 2023-06-03
编程技术问答社区
对PHP和XPath的帮助
我需要帮助在php中使用XPath做一些事情. 使用任何给定的HTML,我需要: 删除所有表及其内容 第一个H1标签之后删除所有内容 仅保留段落(包括其内部HTML(链接,列表等)) 使用Regex,我的一切正常.但是,当我遇到嵌套桌子时,我认为用Regex解析HTML确实是愚蠢的. 非常感谢! 解决方案 使用任何给定的HTML,我需要: •删除所有表及其内容 •第一个H1之后删除所有内容 标签 •仅保留段落(包括 他们的内部HTML(链接,列表等)) XSLT 可以很容易地完成此操作:
0 2023-06-03
编程技术问答社区
PHP DOM遍历HTML节点和子节点
我正在使用一些代码从HTML页面挑选所有标签: $dom = new DOMDocument; $dom->loadHTML($html); foreach ($dom->getElementsByTagName('td') as $node) { $array_data[ ] = $node->nodeValue; } 这将数据存储在我的数组中. 正在查看的HTML数据IS: DATA 1 DATA 2 DATA 3 $array_data返回: Array([0])=>DATA 1 [1]=>DATA 2 [2]=> DATA 3) 我所需的输出是从与页面上关联的标签中获取代码.所需的输出: Array([0])=>DATA 1 [1]=>12345 [2]=>DATA 2 [3]=> DATA 3) 我认
0 2023-06-03
编程技术问答社区
用于HTML标签的Regex
我正在做以下操作: 这样我就可以摆脱 标签并在字符串的末端放置一个空间(这是用于页面的样式). 这完全适用于" Something ". 但是,带有以下文字: Section 1.10.32 of "de Finibus Bonorum et Malorum", written by Cicero in 45 BC "Sed ut perspiciatis unde omnis iste natus error sit voluptatem accusantium doloremque laudantium, totam rem aperiam, eaque ipsa quae ab illo inventore veritatis et quasi architecto beatae vi
0 2023-06-03
编程技术问答社区
用PHP Dom解析畸形的HTML
我有一个客户,希望他们的网站上显示他们的视频(由第三方提供).该网站使用swfobject显示视频,所以我认为最容易抓住它并稍微修改它,以便它在客户端的网站上工作. 使用php domdocument似乎是要走的路,但是不幸的是,所提供的HTML被畸形并引起心脏病发作.是否可以忽略HTML中的错误或可以做到这一点的另一种方式? 解决方案 这就是 php tidy for a html document true, 'output-xhtml' => true, 'wrap' => 200); // Tidy $tidy = new
0 2023-06-03
编程技术问答社区
在php/regex中解析表格内容并通过td获得结果
我有这样的桌子,我花了一整天的时间试图从: 中获取数据 Monthely rent Fr. 1'950. Rooms(s) 3 Surface 93m2 Date of Contract 01.04.17 您可以看到数据井井有条,我正在尝试获得此结果: monthly rent => Fr. 1'950. Rooms(s) => 3 Surface => 93m2 Date of Contract => 0
0 2023-06-03
编程技术问答社区
PHP Regex删除最后一段和内容
我在MySQL表中存储以下内容: First paragraph Second paragraph Third paragraph Some paragraph here Specs: Weight: 10kg LxWxH: 5mx1mx40cm This is the paragraph I am trying to remove with regex. 我正在尝试删除表中每个行上的最后一段标签和内容.我可以很容易地用php循环循环,但是我的正则是我陷入困境的. 我在stackoverflow上发现的每个preg_match都会给我一个" preg_match():未知修饰符"错误,或者var
0 2023-06-03
编程技术问答社区
DOM解析器的取值
有人知道为什么这不起作用吗? foreach($html->find('tbody.result') as $article) { // get retail $item['Retail'] = trim($article->find('span.price', 0)->plaintext); // get soldby $item['SoldBy'] = trim($article->find('img', 0)->getAttribute('alt')); $articles[] = $item; } print_r($articles); 解决方案 尝试以下方法: $html = file_get_html('http://www.amazon.com/gp/offer-listing/B002UYSHMM'); $articles = array(); foreach($html->find('table tbody
0 2023-06-03
编程技术问答社区
file_get_html()返回垃圾信息
我正在使用Simple_html_dom Parser. 以下代码是返回垃圾输出: $opts = array( 'http'=>array( 'method'=>"GET", 'header'=> "Accept: text/html,application/xhtml+xml,application/xml;q=0.9,*/*;q=0.8\r\n". "Accept-Encoding: gzip, deflate\r\n". "Accept-language: en-US,en;q=0.5\r\n" . "User-Agent: Mozilla/5.0 (Windows; U; Windows NT 6.0; en-US; rv:1.9.1.6) Gecko
2 2023-06-02
编程技术问答社区
如何在用DOM解析时保持HTML格式不变--(无标签剥离)。
使用DomDocument,我正在尝试阅读HTML文件的一部分,并使用以下代码在不同的HTML页面上显示它.我要访问的DIV部分具有多个 标签.问题是当DOM解析文件时,它仅在 标签 - strips标签之间获取文本内容,并且丢失了段落格式.它将文本合并并显示为一段.如何保持HTML格式化,以便在源文件中显示段落? html代码 Title Lorem ipsum dolor sit amet, consectetur adipiscing eli. Lorem ipsum dolor sit amet, consectetur adipiscing eli. Lorem ipsum dolor sit amet, consectetur adipiscing eli. Lorem ipsum dolor sit amet, consectetur adip
0 2023-06-02
编程技术问答社区
带有多个表格的PHP简单HTML DOM解析器
我正在尝试从当地天气渠道网站解析HTML数据,以获取我当地周围学校,企业和教堂的关闭信息. 我已经遇到了问题,尽管这些信息包含在没有我可以使用的ID的表中. 下面我包括了一个HTML表的示例.是否可以将多个HTML表解析,并使用PHP使用HTML DOM解析器拉包含数据.我已经阅读了谢谢! 编辑:我可能还应该指定我要获取这些数据并能够将其解析为JSON数据以将其用于加载应用程序.因此,基本上有组织名称,然后是我可以从JSON页面获取的状态. 链接到天气频道网站 Organization Status BEACON HOPE CHURCH - GRA
0 2023-06-02
编程技术问答社区
XML解析器与REGEX
我应该使用什么? 我将获取链接,图像,文本等 您建议使用什么? XML解析器或正则 我一直在使用正直,但从来没有任何问题害怕使用XML解析器并更喜欢Regex(并且可以很好地服务于目的) 所以,如果一切都与Regex运行良好,为什么我在这里问您要使用什么?好吧,我认为,即使到目前为止一切都很好,也不意味着它也会在将来,所以我只是想知道在Regex上使用XML解析器的良好是什么?表演是否有任何改进,较少的错误,更好的支持,其他光泽功能等? 如果您建议使用XML解析器,则建议将其与PHP一起使用 我绝对想知道为什么你会选择一个? 解决方案 我应该使用什么? 您应该使用 a xml parser . 如果您建议使用XML解析器,则建议将其与PHP一起使用 请参阅: php . > 其他解决方案 如果您正在处理现实世界(x)html,则您需要一个HTML解析器而不是XML解析器,因为XML解析器需要在遇到良好的错误错误后立即停止解
0 2023-06-02
编程技术问答社区
Simplexml:解析HTML时遗漏了带有文本节点的元素内部的嵌套元素
我试图解析特定的HTML文档,某种词典,大约有10000个单词和描述. 它进行得很好,直到我注意到特定格式的条目不能很好地解析. 这是一个示例: zot; zotz Nista; nula. Isto zilch; zip. '; $xml = simplexml_load_string($html); var_dump($xml); ?> var_dump()的结果是: object(SimpleXMLElement)#1 (2) { ["b"]=>
0 2023-06-02
编程技术问答社区
PHP- HTML解析 :: 如何用简单的HTML DOM解析器获取网页的字符集值?
php ::如何使用简单的说明:必须使用html dom parser http://simplehtmldom.sourceforge.net /p> 示例1网页charset输入: 结果:UTF-8 示例2网页charset输入: 结果:Windows-255 编辑: 我尝试这个(但不是有效): $html = file_get_html('http://www.google.com/'); $el=$html->find('meta[content]',0); echo $el->charset; 应该改变什么? (我知道$ el-> charset无
2 2023-06-02
编程技术问答社区
PHP替换除HTML标签以外的字符
我需要在字符串中用\xD9\xA0,\xD9\xA1,\xD9\xA2,...,\xD9\xA9替换字符0,1,2,...,9.该字符串来自CKEditor,因此它可能包含HTML标签.使用以下代码 $body = str_replace("1", "\xD9\xA1", $body); 它用\xD9\xA1代替每个1,因此它会影响标签 以及 ,而我只需要替换体内的数字而不是标签. 包含数字的标签为 和cellspacing和cellpadding和cellpadding和border table标签. 我如何将数字替换为上述符号,而它不会影响 和cellspacing和cellpadding和border? 解决方案 您不应该使用正则义务来处理HTML,但是,如果您仍然想使用正则票据,则可以使用以下等级的丢弃模
0 2023-06-02
编程技术问答社区
php提取正文标签内容
我正在尝试应该非常简单的事情,但是我无法正常工作.这让我想知道我是否正在使用正确的工作流程. 我有一个简单的HTML页面,我将其作为帮助文件中加载在桌面应用程序中.此页面不仅菜单. 在我的网站上,我想拥有一个更复杂的帮助系统.因此,我想使用一个PHP文件,该文件将显示菜单,面包屑和标头和页脚. 为了不复制我的帮助内容,我想加载原始的HTML帮助文件并将其身体内容添加到我的增强帮助页面. 我正在使用此代码提取标题: function getURLContent($filename){ $url = realpath(dirname(__FILE__)) . DIRECTORY_SEPARATOR . $filename; $doc = new DOMDocument; $doc->preserveWhiteSpace = FALSE; @$doc->loadHTMLFile($url); return $doc; } functi
0 2023-06-02
编程技术问答社区