2010年03月
1 2 3 4 5 6
7 8 9 10 11 12 13
14 15 16 17 18 19 20
21 22 23 24 25 26 27
28 29 30 31




ブログ引越し支援アプリ(1) [2010年03月31日(水)]

作っていたアプリをupしてみる。
使いたい人はどうぞ。

http://balsamic.fam.cx/up-insalata/download/1268666728.zip
PASS:isao

中のテキストに書き忘れたのですが、保存元のURLの指定は
http://track-back.net/kourin/archive/
こんな感じで行ってください。
一記事のTOPですね。
自分のTOPのアドレスに "archive/"とつけた形です。
後はアプリがこれの後ろに数字を加えながらデータを取りに行きます。(3/16追記)


注意:
・使い方はzipの中に入っているテキストファイルを読みましょう。
 意味が分からなくても根性で。

・使用は自己責任で。なんかあっても私は責任負いません。
 使用の際は慎重に。

・ウィルスチェックとかも自分でやりましょう。
 一応こっちでもオンラインウィルススキャンは掛けてはいますが。

・きちんと引越しできなかったとしても文句言わない。
 こっちもテストBlogに引越しさせるのそれなりに苦労してます。


ISAOからのメール [2010年03月17日(水)]

なんぞISAO&DTIからメール来た。

なになに?
31日にブログ終わるから
手動でバックアップせよ?

なお、引越し先はlivedoorブログがお薦め

とな?


おいおい、あそこはMT対応してるんだが
その癖に未だ手動とか馬鹿こいてるのか
DTIやisaoには技術者はいねーのか?

俺だって家でだらだらやるレベルで自作できたのに
仕事でやるべき連中がやりもしねーし
未だ非現実的な事いってんのか

ほんとなぁ…
馬鹿だろ 大馬鹿だ 自分達が提供してるサービスや
そこにぶら下がってるユーザーを何だと思ってるんだ?

ブログ引越し計画-完了 [2010年03月14日(日)]

最期のテスト完了。

とりあえず、そこそこの数への引越し作業において
TRACK-BACKブログの管理画面における
記事数/コメント数/トラックバック数 全て同じ数字にできました。
(ヤプログは試しに作業するのも嫌になったのであれから検証してない)

ブログ人(OCN) - 世界の端っこ行き止まり(実験農場)
FC2 - 世界の端っこ行き止まり(第二実験農場)
livedoor Blog - 世界の端っこ行き止まり(第三実験農場)
ココログ(nifty) - 世界の端っこ行き止まり(第四実験農場)
DTIブログ - 世界の端っこ行き止まり(第五実験農場)

とりあえず、5つもできれば十分かなと。
それぞれMTの解釈に癖があったりしたりもしましたが
この通り、きちんと引越しに成功してます。
画像は無理ですけどね。
MTインポート形式自体、画像までは対応してないんで。

んんー 時間掛かったけど、ま、間に合ってよかったよかった。

細かく見るとエラーたくさん [2010年03月11日(木)]

よし最後のテストだ!
と始めてみると、今まで見逃していた部分が沢山でてきたー!

各ブログ側の設定でこっちが勘違いしていた所もあるんだけど…
(OCNはutf-8推奨してるだけで沢山受け付けるとか、FC2はエンコードを自動判別してくれるとかとか)

一番素直だと思っていたOCNのブログ人でも結構インポートに失敗している… だと!?

うちの記事がこの記事を抜くと、管理画面では1477と出てくるわけですが
OCNでインポート完了するとそれを下回る。
コメントも数個少ない。トラバは何故か全部インポート成功してるが…。

TB側だと、最新記事Noが1489、削除して穴あきになってるのが12個。
(これはタイトル未記入記事は許可されてないからプログラムで検知できる)
あわせえて1477… うんあってる。

で、出力したMTファイルを"TITLE: "(記事タイトルの印)で検索すると…
1493行… だと? どっから沸いたこの16つの記事!?

うーん いいとこまでいってるんだけどなぁ…

何が悪いんだろう?

********************************
TITLE:はPINGSでも出てくるから間違いではなかった…
かわりにBASENAME:で統合ログで検索すると…
あれー? 数が少ない… でも個別ログのフォルダはきちんとある
つまり統合ログへの書き込みで失敗する場合がある… と?
ってことはOCN側は正常に処理を行ってると考えたほうが妥当だなぁ…
ローカルHDDへの保存なんて容量オーバー以外で失敗なんてしないだろーw
とか侮っていたのがまずかったか? とりあえず例外きちんと出力してみるか…。
********************************
別のプロセスで使ってるから開けない… だと?
いやいや、別のスレッドも別のプロセスもこのファイルはアクセスしてませんよ。
ナニイテンダ! .Netが裏で勝手に触ってるのか?
うーん…。
普段使ってるデバッグ出力用の関数を流用したのがあかんかったか…
直すか…。

TBバックアップ計画続き [2010年03月07日(日)]

またちょっと改造してみた。
そしてそれでもって、今度はココログlivedoorブログアメブロでインポート実験。

結果
アメブロ:
MT非対応 終了!

livedoorブログ:
euc-jpで対応! 概ね問題なさそう!

ココログ:
マルチエンコード対応! でもインポート失敗!
utf-8のファイルをutf-8指定で食べさせると弾かれるのは何故なんだぜ?
utf-8の先頭6バイトいらないタイプのutf-8しか受け付けないとかそいうオチか?

euc-jpだと対応していたのだが、困った事に、
BODY:データだけの記事はフォーマット違反扱いで弾く
という不思議仕様という事を発見。

概要やら追記分を空でもいいから入れると通るのは確認したが…
そもそも必須はBODY位で他のはいらんだろ。
ちなみに、ここのBlogシステムとOCNのブログ人のシステムは同じものを使っているようですが、OCNの方はそこらへんきちんと対応していてくれます。
というか必須とはならなさそうなデータに関しては無くても受け付けてくれます。

というか、常識的に考えてそういうモンだろう。
追記とか概要なんて無いことが普通にありえるデータだし。
というか無いほうが多いだろうし。

まぁ…
だから直せとココログに迫るわけにも行かずー
仕方が無いのでテンプレートを弄るか、プログラムにオプション追加…
という形でしょうか。

ちなみにココログはアップに制限があって、1Mを超えるファイルは弾くので
MTインポートファイルは適当な大きさに裁断する必要あり。
まぁ、ファイル分割の機能つけたんで1、200記事位で裁断かければ
手作業はないとは思うんですけどね。
やっつけ仕事の分割処理だが早速役立ちそうだ。
ちなみに実験の際はそんな事しらんので手でやりました。
めんどくせぇ…。

さて、まとめてみるとこんな感じですね。
**************************************************
■OCN(ブログ人) 対応
 utf-8の縛りはあるけど素直にMTフォーマットを解釈してくれる。
 ファイルサイズの指定がないので1ファイルでもきちんと食べてくれる。
 問題があるとすれば、コメントやトラバを拒否設定にしても、
 コメントやトラバのデータがあると自動的に許可状態にしてしまう所。
 まぁ…そんな大した問題ではないけど。
 (むしろ人によっては便利に感じると思う)

■FC2ブログ 対応
 euc-jpの縛りはあるけど、ここも結構素直にMTフォーマットを解釈してくれる。
 というか、おそらくここが一番かも。
 コメもトラバもインポート成功しても許可状態にはなりません。
 データの通りに継承されます。つまり後で記事毎に自分で許可する必要あり。
 まぁ、それが面倒だという場合も考えてテンプレートとブログラムを修正しちゃったけど。
 でかいファイルは途中で諦めてしまうんで、そこそこのサイズで分割する必要あり。
 管理UIは簡潔で見やすく好感が持てる。すっきり最高。

■ヤプログ: 非対応
 一応対応をうたってはいるけど、他のBlogでインポート可能なデータを
 まるでインポートできない時点で大きな問題。
 対応エンコードもきちんと書いて無いし、論外。

■アメブロ: 非対応
 多分非対応 メニューからインポートできそうな場所捜しても
 みつからんかった。
 (つかあったとしても捜して見つかりづらいなのは論外)

■livedoorブログ: 対応
 euc-jpの縛りはあるけど概ね問題なし。
 ここは3分割位でファイルを食わせたけど、1ファイルで食いきるかは試してない。
 なんとなくUIの非同期処理大好きっぷりをみていると、1ファイルでいけそうな気がする。

■ココログ: 対応
 ステキなマルチエンコード対応。(ただし何故かutf-8は弾かれる)
 BODYだけの記事のデータは軒並み弾き倒すという意味不明処理だが、
 そこらへんはテンプレートやプログラムで対応可能なので不問とする。
 ファイルは最大1Mまでなので、ファイル分割は必須。
 システムはOCNのブログ人と同じ。
 でもMTインポート処理を見てると、OCN側の方がより良く使うための工夫をしているなというのが分かる。

********************************************
こんな感じですかね。

こんだけ実験すれば十分だろうから
これを元に再度テンプレートとプログラムの調整をかけて
上記ブログで実験して問題なければ終了。

さーて、ココログ対応したら他ので支障がでたとかなったら
どうすっぺかーw

TB-BLOGバックアップ [2010年03月05日(金)]

とりあえず、これの続きナわけですが。
2つ試してみた。

FC2-Blog
http://kourinhuuga.blog70.fc2.com/
FC2はこの通り概ね大丈夫そうです。
(記事でトラバとコメの受付を跳ねてるので、コメやトラバのデータは入ってるけど表に出てこない。これはAllowの設定を1で出したほうがいいって事かな、OCNだとコメやトラバがあると自動的に許可に切り替えてたけど)
ただ、ログがでかすぎると処理を中断されてしまうようで
うちのBlogレベルでも弾かれてしまったので
プログラムで出力する時に、数百記事毎に出力するオプションが必要かなぁ?
まぁ、自分で少しずつ切り出しながらファイル化してそれ読ませれば何も問題ないわけですが。

問題があったのがヤプログ
まずヘルプにインポート機能の項が無い
もちろんインポートページにもまともな説明も無い。
インポートファイルのエンコードについても言及が無い。(地味に大きな問題)
じゃあ文字エンコードを自動判別して処理を切り替えてるか?というと
まったくそんな事は無い。(カテゴリー文字が化けるのでそれが分かる)
FC2やOCNのインポートに成功するフォーマットなのに、
何故か記事が1件も登録されず、コメントが800件登録とか意味不明な状態が発生する
おまけに、コメントを消そうとするとコメント一覧が表示されず消せない
論外!

後、2,3実験したいもんだなぁ

Dead-end edge of the world (currently experimental) [2010年03月04日(木)]

ここ暫く、実験用にテンプレートを変更していたせいか
全然リファーが残っていない状態だったのですが
今日、久々に元に戻したら英語翻訳されたURLが出てきた

日本語:世界の端っこ行き止まり(現在実験中)

英語:Dead-end edge of the world (currently experimental)


よく分からないけどかっこいい!

なんか前にも同じネタを使った気がするんだぜ…

TB-BLOGバックアップ [2010年03月04日(木)]

とりあえず。

OCNのブログ人というBlogにデータを写してみた。

ここはOCN会員は最低レベルのコースなら無料で使える所で、
Movable Typeインポートに対応してます。
(対応具合は前記事の通りといった感じですが)

バックアップしたデータと記事のタイミングの都合上全部ではありませんが
この通り、内容はほぼ同じく転送する事に成功しています。

世界の端っこ行き止まり in OCN

コメントやトラックバックも(多分)全部成功していると思うけど
流石に量が量なので確認してません。

まぁ、なんとかなるもんですね。
他にも幾つかMTインポート対応してるBlogで実験してみるかな。
Blog毎に癖みたいのもあるんだろうなぁ…同じデータで成功すればいいんだけど。
 
 
 
続きを読む...

MTインポート実験 [2010年03月04日(木)]

丁度ISP引越し先のOCNのBLOGがMTインポートに対応していたので
これは丁度いいと実験場にしている。

Trackback-blog側の出力の異常仕様なんかはプログラム側で強引に
帳尻合わせる形でなんとかいいとこまでこぎつけて
概ねインポートには成功してるんだけど
先方のインポート処理にバグがあるのか
正常にインポートされない現象に遭遇。

何が問題で誤動作が起きてるかというと、
やっぱりねーという感じのセパレータ問題。
本来であれば、"-----(改行)"、"--------(改行)" の2つが
複数記述可能部分の各パーツの終端や記事の終端だったりするのだけど
-が40個並んだ時点で記事終了扱いになるっていう変な現象。

ならば最小単位の-x5個当たりで-x4+空白にでも置換を行えば回避はできそう…
なんだけど、なんかそんな場当たり的な事してもどうなのよ…みたいな
きちんとBodyやらExtended Bodyの中身だけやらなあかんとなると
プログラムで処理する為の特殊タグ打ち込んで引っ張り出さないとあかんし
本文でそれを打ち込まれたら誤動作の元になるし…

XMLで出力して、そこから再構成を狙えばよかったかなぁ…
でも流石に今からそれに舵を切りなおすのは間に合うか判らん
普段XMLなんて滅多さわらんから操作方法勉強し直しだし

あー めんどくせー

あらかたできた [2010年02月22日(月)]

Movable Typeのフォーマットを直接サーバーに出力させる形に変更。
(元はプログラムである程度操作するつもりだったが面倒なのでやめた)
html構文お構いなしで、そのままText出力してるので1記事表示はめためたです。
ブラウザの"ソースを表示する"でどんなもんかは判るかと。

ただ、困った事に特定条件で分岐させる特殊タグが判らんとか
思った通りに動かないので空データまで出力されてしまう。
<BlogEntryIfExtended>が<BlogEntry>の外でも稼動してくれれば、その記事に追記がある無しで出力を分岐させる事ができるのだけど…。
何故か動かない。
いや、用途を考えればそんな機会は少ないだろうから対応してないのは頷けるのだが…、だったらバックアップツールや移行ツールを自分で出せと。

ともあれ、Movable Typeのサイトのインポート仕様には概ね沿った形では出力できていそうだ。
してないかもしらんが、実権環境がないのでまぁ、文字面から把握できる範囲でこれなら問題なかんべ。
テンプレと対になる指定の範囲で記事をどこどこテキスト化するプログラムも作り終わったし、後はこいつの機能拡張だな。

とりあえず、Bodyの解析をしてImageをDownloadする形にしたいんだが…
.Net Frameworkってhtmlの構文解析クラスあったっけ?
面倒くさそうだなぁ…。なかったらやめっか 面倒だし…。
| 次へ
trackback Blog by isao.net