« Objective-C 2.0を使ってコードを書くのはよくよく考えてからにした方がいい。 | ホーム | Intermezzo 0.7.2リリース »
2009年1月24日
HTMLを簡単にparseしたいのに簡単にいかない件。
そして表題で大分言いたいことが言い切れてしまう件。
やりたいのは、HTMLの内容をparseして<title>の内容を拾うだけ、なんですけども。最初NSXMLDocumentのNSXMLDocumentTidyHTMLモードで読み込むと、charsetが読み飛ばされるのか、文字コードの判別にしくじって文字化けが頻発するもので。どうもus-asciiが半強制的に指定されてしまう模様。かと言ってWebView使うのもなあ、1ページloadRequest:に渡すだけでインライン画像やスクリプトやら関連するファイル全部読み込みに言ってしまうので、うーん、まあ、どうしたもんかなあ。
トラックバック(0)
トラックバックURL: http://foursics.jp/cgi-bin/mt/mt-tb.cgi/240
コメントする