« Objective-C 2.0を使ってコードを書くのはよくよく考えてからにした方がいい。 | ホーム | Intermezzo 0.7.2リリース »

2009年1月24日

HTMLを簡単にparseしたいのに簡単にいかない件。

そして表題で大分言いたいことが言い切れてしまう件。

やりたいのは、HTMLの内容をparseして<title>の内容を拾うだけ、なんですけども。最初NSXMLDocumentのNSXMLDocumentTidyHTMLモードで読み込むと、charsetが読み飛ばされるのか、文字コードの判別にしくじって文字化けが頻発するもので。どうもus-asciiが半強制的に指定されてしまう模様。かと言ってWebView使うのもなあ、1ページloadRequest:に渡すだけでインライン画像やスクリプトやら関連するファイル全部読み込みに言ってしまうので、うーん、まあ、どうしたもんかなあ。

トラックバック(0)

トラックバックURL: http://foursics.jp/cgi-bin/mt/mt-tb.cgi/240

コメントする

OpenID対応しています OpenIDについて

このブログ記事について

このページは、Hironobu Kouraが2009年1月24日 14:19に書いたブログ記事です。

ひとつ前のブログ記事は「Objective-C 2.0を使ってコードを書くのはよくよく考えてからにした方がいい。」です。

次のブログ記事は「Intermezzo 0.7.2リリース」です。

最近のコンテンツはインデックスページで見られます。過去に書かれたものはアーカイブのページで見られます。