NAKAMURA Minoru の日記 (2003年2月)

先月の日記(2003年01月) 今月の日記(2003年02月)
2002 | 10 | 11 | 12
2003 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12
2004 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12
2005 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12
2006 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12
2007 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12
2008 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12
2009 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12
2010 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12
2011 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12
2012 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12
2013 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12
2014 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12
2015 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12
2016 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12
2017 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12
2018 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12
2019 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12
2020 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12
2021 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12
2022 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12
2023 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12
2024 | 1 | 2 | 3 | 4
ホームページ | 最新のコメント50
インデックス: 食べ歩き | Java | プログラム | UNIX | 画像
最新の日記へのリンク | この日記ページをはてなアンテナに追加 この日記ページをはてなブックマークに追加
はてな ダイアリー アンテナ ブックマーク ブログ
Twitter | mixi | Facebook | slideshare | github | Qiita



2/28 (金)

不正アクセスの集計

先月の 1/31 に これまで集計のために使っていた IP リストに間違いが見つかったので、 今月までの記録を再集計してみた。

アクセスホスト(IP)数
順位国別割合
1US (アメリカ)27.90%
2CN (中国)9.76%
3KR (韓国)8.20%
4CA (カナダ)3.85%
5BR (ブラジル)3.85%
6JP (日本)3.66%
7TW (台湾)3.57%
8DE (ドイツ)3.44%
9MX (メキシコ)2.89%
10UK (イギリス)2.52%
     
アクセス数
順位国別割合
1US (アメリカ)28.73%
2CN (中国)9.81%
3KR (韓国)8.20%
4JP (日本)5.89%
4CA (カナダ)3.85%
5BR (ブラジル)3.49%
7TW (台湾)3.45%
8DE (ドイツ)3.14%
9MX (メキシコ)2.67%
10UK (イギリス)2.20%

アメリカが突出していて、 中国・韓国がそれに続き、 それ以下が続いている。
IP リストを更新した結果、 誤検出していた ウルグアイ(UY) がほとんどなくなったが、 ブラジル(BR) と メキシコ(MX) がずいぶん増えた。 これが本当の増加分なのか、 リストにまだ誤りがあるのかは もう少し調べて見ないと分からない。

2月分の記録は以下の表のようになる。

アクセスホスト(IP)数
順位国別割合
1US (アメリカ)31.37%
2CN (中国)12.20%
3JP (日本)5.66%
4DE (ドイツ)3.92%
5UK (イギリス)3.27%
6MX (メキシコ)3.27%
7IT (イタリア)3.27%
8BR (ブラジル)3.27%
9CA (カナダ)3.05%
10KR (韓国)2.40%
     
アクセス数
順位国別割合
1US (アメリカ)34.22%
2CN (中国)12.87%
3JP (日本)9.42%
4KR (韓国)3.30%
5DE (ドイツ)3.14%
6CA (カナダ)3.14%
7MX (メキシコ)2.67%
8IT (イタリア)2.67%
9BR (ブラジル)2.51%
10UK (イギリス)2.35%

SQL Slammer 対策のせいか 韓国からの不正アクセスしてきたホスト数がずいぶん減っているのが分かる。
ただ、アクセス数で数えると依然多い。

あと、 ここ数ヵ月を見てみると 日本からの不正アクセスが じわじわ増えてきている。
よくない傾向だ。


2/27 (木)

[Compiler] Advanced Parallelizing Compiler (APC) はもうすぐ総括

読売新聞には 「コンピューター並列で処理速度10倍に、新ソフト開発」 というタイトルの謎の記事が出ている。

日立製作所と富士通、早稲田大学、産業技術総合研究所などは27日、 産学官の共同開発により、複数のコンピューターを並列につないで、 最新鋭のコンピューターより10倍以上速く演算処理ができるソフトを 開発したと発表した。

いったい何じゃこりゃという内容だが、 こいつは Advanced Parallelizing Compiler (APC) という国家プロジェクトに絡む話。
プロジェクトの目的はぶっちゃけて言うと、 High Performance Computing 用の 自動並列化 FORTRAN を作ろうというもの。 と言っても 実際に作成するのは 逐次 FORTRAN プログラム → 並列化 FORTRAN プログラム を行うコンパイラ - コンパイラ。 また 共同開発 というが、 実際は各組織が別々のアプローチで 並列開発 をしている(していた)。

対象となる並列計算機は SGI (Origin2000)、 SUN (Ultra80)、 Compaq (AlphaServer GS160)、 IBM (RS6000, p690) など。
SPEC FP2000 や NAS Parallel Benchmark をターゲットとし、 これを並列化 FORTRAN プログラムで変換。 IBM XL FORTRAN や SUN Forte FORTRAN のような ベンダー製 FORTRAN コンパイラで翻訳して実行。
性能を、元のベンダー製コンパイラや、 PGC や KAP のような並列コンパイラ屋の コンパイラに勝てれば成果ありということになる。

APC のプロジェクトは今年で終わりになる。
その総括として、 3/20 に偉い先生をいっぱい呼んで APC2003 アドバンス並列化コンパイラ技術国際シンポジウムが開かれる。 各社のコンパイラが 本当にどれだけ性能が向上したのかは それまでお楽しみ。


2/26 (水)

Tim Berners-Lee も WWW がこんな目的のために使われるとは思うまい

Web サーフィン(←死語)をしている際に見つけた変なサイトを まとめてみた。

The Evolution of a Programmer (プログラマの進化)
高校生/中学生からはじまって色々な立場の人が "Hello World" と表示するプログラムを綴る。
年を取るにつれて "Hello World" と出力する プログラムは段々長くなって...
Bjarne Stroustrup Interview about C++
1998年、 IEEEの "Computer" マガジンの編集者が、
コンピュータ言語 C++ の産みの親 Bjarne Stroustrup 博士に行ったインタビュー記事。
その衝撃の内容とは。。。
シュレディンガー音頭
理系学生なら踊れて当然(?)と言われている シュレディンガー音頭のページ。
GIF アニメーションで踊り方の解説してくれる。 一部、人間には不可能な振付けがある。
プサイにファイ、プサイにファイ、世の中みんな波だらけ♪
cdbiff
高林哲氏の書かれたメールの到着を教えてくれる biff 系プログラム。
Ruby で書かれているそうだ。
最強キャラ決定!東京ドーム地下闘技場最大トーナメント!
まぢめ氏の ゴルゴ13 最後の真実のページ。
マンガの登場人物のうち誰が最強かを巡って 2ch の掲示板などでは 熱い論争が繰り広げられているが、 このページでついに最強のキャラクタが誰なのかが明らかに...
だめ人間計画産業廃棄物
社会問題のパロディ風刺。 宗キュン!はぁとふるCafe 君が望む政権とか 元ネタがアレゲだ...
噂は本当だったんだ
とほほ。。。

2/25 (火)

MS SQL Slammer ワーム 小活躍の巻

MS SQL Slammer がまだくすぶっているようだ。
先月末から今月の頭に掛けて攻撃が止んでいたのだが、 中旬より復活。 元気に 1434/udp ポートを叩いている。

日付 2/6 2/10 2/11 2/12 2/13 2/14 2/15 2/16 2/17 2/18 2/19 2/20 2/21 2/22 2/23 2/24 2/25
アタック数 1 2 2 1 6 9 12 18 5 6 7 5 8 11 8 10 17

アメリカ(.us)からのアクセスが圧倒的に多く、 中国(.cn)がそれに続いている。
他のウィルス・ワームではなかなかお目にかかることのない .cl(チリ).do(ドミニカ共和国)、.mx(メキシコ).no(ノルウェイ).se(スウェーデン).sv(エルサルバトル) などの珍しい国からのアタックもあり。


2/24 (月)

IP アドレスから国別トップドメイン(ccTLD) を検索する CGI

ここに、 IP アドレスから国別トップドメイン(ccTLD) を検索する CGI を暫定設置した。
CGI なので IP アドレスから ccTLD への変換テーブルを毎回読み込むことになり、 オーバーヘッドが大きい。
アクセスが多いようならば、Servlet に作り直すつもり。


2/23 (日)

[CPU] PNI (Prescott New Instruction) の詳細が明らかになる

2/20 にも書いたが Intel の P4 後継 CPU Prescott の 拡張命令の資料が出た。
Hyper-threading 用の同期命令 MONITORMWAIT は 以下のような効用があるようだ。

通常の SMP マシンで同期ロックを使う場合、 ロック所有スレッドの走るプロセッサと ロック待機スレッドの走るプロセッサとの間で、 キャッシュの奪い合いが問題となる(待機スレッドは複数いるかもしれない)。 これは、 ロックを待機スレッドが ロックの開放を確認するために行う read によって、 プロセッサ間でキャッシュが激しく行ったり来たりする現象 (cache slashing)を起こすためである。
Hyper-threading を持つ P4/Xeon の場合、 L1 キャッシュを共有しているために キャッシュのスラッシングは起きないが、 同一プロセッサ内の 2 つの論理プロセッサが 同一ロックデータに read/write を集中させるため、 ロード・ストアユニットの競合が起きる。

結局、競合を解決するためには、 ロック所有スレッドがロックを開放したという情報を メモリを介する以外の手段によって通知できればよい。 通知がこない間はロック待機側のスレッドは何もせずに待機すればよい。

MONITOR 命令はロックのデータ構造を監視するメモリ範囲としてセットする。 以降、 このメモリ範囲へのストア命令が監視され、 書き込みがあると monitor event pending flag をオンにする。
MWAIT 命令は monitor event pending flag を CPU の内部で監視し、 監視メモリ範囲に書き込みがあるまで待機しようとする。

trigger = 0;

if (! trigger) {
   EAX = &trigger
   ECX = 0
   EDX = 0
   MONITOR EAX, ECX, EDX  
   if (! trigger) {
      EAX = 0;
      ECX = 0;
      MWAIT EAX, ECX
   } 
}

#0 と #1 の 2 つの論理プロセッサがある Prescott がある場合、 上のプログラムが #0 で実行されると、 #1 が tigger の内容を変更するまで #0 は MWAIT 命令の部分で待機することになる。

参考


2/22 (土)

[Movie] LOTR:TTT を見に行く

Aze 氏と共にThe Lord of The Rings: The Two Towers を、新百合ヶ丘のマイカル・ワーナーで見る。

朝の 7 時半に着くが、すでに 40 名ほどの行列ができている。 8:55 上映の字幕版を見る。

冒頭、モリアの鉱道をガンダルフとバルログがジェットコースターのように墜落していくシーンからはじまり、全編すごいスピードで進んで行く。
前作が原作の設定を解説・説明しながらも原作未読の人をおいてきぼりにしていんたのに対して、今作は切るべき所は切って映像と演出で見せることに重きをおいたよう。
先行ロードショーを見た人にはファラミアが悪人になったりヘルム峡谷にロリアンのエルフが援軍に来ると警告されていたが、最後まで見届けた感じではこれで OK だ。
CG のゴラム(ゴクリ)もいいかんじ!

鑑賞後は、横浜の中華街で、飯を食べてから帰る。

P.S.

マイカル・ワーナーではディスニーアニメ「リロ & スティッチ」の立て看板が出ていたが、これに出てくるエイリアンの造型がハラルト・シュテンプケの『鼻行類』を思わせる。


2/20 (木)

今日もいろいろネタがある

今日もいろいろネタがある。 IT の世界は日々動いているなぁ。

Microsoft が Connectix 社の Virtual PC を買収
すでに Macer な人達は大騒ぎになっていて、 ネットワークのあちらこちらでお祭 騒ぎだ。
Visio の買収の時と違い Connectix 社 自体は残り、製品を開発者ごと買うらしい。

MS が何を意図して Virtual PC を買うのかで百家鳴動している。 Virtual Server が欲しかったとか言う人もいるが、 どうせ IA-32 の大規模 SMP マシンは出っこなし、 仮に存在したとしても Virtual Server では役者不足だろう。
むしろ Trustworthy Computing の実現のために、 クライアント側で利用するのではないかと思う。
どちらにせよ、どうする VMware 社?
PNI(Prescott New Instruction)
Intel Developer Forum (IDF) Spring 2003が開かれているが、 現在の Pentium4 の後継となる Prescott の機能が 明らかにされたようだ。
注目は、 Prescott から Pentium4 の命令セットに、 PNI(Prescott New Instruction)と呼ばれる 追加された 13命令。
その中でも 1番注目は MONITORMWAIT。 同一 CPU 内で Hyper-threading 動作している 別のスレッドと同期処理が取れるようだ。
NEC IA-64 Linux R3.2
Intel を最大スポンサーにして IBM、HP、SGI、VA Linux、Red Hat、Turbo Linux などが 参加していた IA-64 Linux Project。 すでに、Red Hat、Debian などが IA-64 の distribution を完成させているが、 以外な伏兵 NEC も NEC IA-64 Linux R3.2 を完成させていたようだ。
しかも、 SPEC CPU2000 のスコアも登録していた。CFP2000 の base 値の部分だけだけど。

Itanium2 1GHz の TX7/i9010 で 1,298、 同 TX7/i9510 で 1,259
CFP2000 は HP が hp server rx26000 で 1,427 を叩き出しているから スコア自体は驚く程ではないが、 問題は C/C++/FORTRAN のコンパイラが自社製品だということ。
当然、今頃は HPC 向けの並列化コンパイラを作っているのだろうなぁ。
Fujitsu Siemens から x86-64 の IA サーバが...
Intel に魂を売ったはずの F 社が、 AMD Opteron システムを 出すらしい
Fujitsu-Siemens の 計画書 にもあるよ。
大丈夫なのだろか? Intel からいじめられるよ。。。

2/19 (水)

[Java] BEA 社の WebLogic JRockit 8.0 がリリース

IA-32 / Linux & Windows2000/XP 用の JavaVM JRockit の 8.0 が 公開された。
BEA のホームページから無料でダウンロード可能 (要登録)。
Technology Preview として IA-64 / Windows 2003 Server 用のも ダウンロード可能。

7.0 は J2SE 1.3.1、1.4.0 相当だったが、今回から J2SE 1.4.1 に対応。
1.4 系で追加された API が利用できるようになっている。
SUN の Hotspot VM は 1.4.0 → 1.4.1 で いろいろ JIT コンパイラ周りのエンバグやライブラリの性能劣化が起きているが、
JRockit はチューンされていて 7.0 よりも高速になっている。
JRockit が Web ブラウザのプラグインにさえ対応してくれれば、 こちらをデフォルトにしてもよいのに...


2/17 (月)

[Java] Sun Java2 SE 1.4.1 は相変わらずバグバグ

J2SE 1.4.1 はマイナーバージョンアップして 1.4.1_01 になったが、 直っていないバグが多くて困っている。
特に Server VM の方は JIT コンパイラがバグっていて、 翻訳中に JVM が abort する。

ちゃんと直して欲しいのだが、 SUN のJava 関連製品のバグ報告ページ Bug Paradeには バグ報告が積み上がっている。 その上、直ってないバグ報告の中には SUN が「再現性なし」ということで 処理済にしてしまうものもある。
SUN も Microsoft のことを笑えない。

追記: 3/5

1.4.1_02 が出た。
でも、まだバグが直らない。


2/16 (日)

[Movie] 昨日は The Lord of the Ring: The Two Towers の先行ロードショー

が、あったらしい。
昨日は劇場の前まで行ったのだが、 次の日の仕事のことを考えてそのまま帰ってしまった。
とりあえず前売券を 4 枚に買い増やし、 2/22 日に備える。


2/15 (土)

ケーキの悪い話

西新宿のヒルトンホテルのカフェ マーブルラウンジへ行く。
目的はケーキバイキング。 参加メンバは T氏、H氏。 男3人組は周囲から浮きまくる。

ケーキを食べながら、近況を交換しあう。 3人とも IT 業界にいるので、昨今の景気の悪い話が続く。

肝心のお味のほうだが、ケーキ単体としては美味しい。
しかし、ケーキの種類が絶対的に少ない。 特にチーズケーキのレパートリーが少ないのが致命的。

やはりケーキの食べ放題は、 本郷・神田の 近江屋が最強だったなぁ。


2/14 (金)

どうも世間的には、バレンタイン・デーらしい

篤志家の方よりチョコレートを頂く。 多謝。


2/12 (水)〜 2/13 (木)

[Work] 徹夜にょ

夜を徹しても作業が続く。
液晶とはいえディスプレイの見すぎで眼が痛くなりそう。


2/11 (火)

DVD を買い直すべきか、買い直さざるべきか

アマデウス(AMADEUS)の ディレクターズカット スペシャル・エディション DVD が出た。
本上映は '84 年だから、すでに 20年近く前の作品だ。
オリジナル版の DVD はすでに持っているが、 今回は 20分の未公開シーンを加えたリニューアル版。
オリジナルの両面1層の構成にも不満があるし、 買い直すべきか?

さらに悩ましいのは NEON GENESIS EVANGELION DVD-BOX(仮)
LD を買い、DVD を買い、さらには DVD-BOX。
また、GAINAX に税金を納めることになるのか...

P.S.
Amazon.co.jp で やっている DVD の「トップ 100」セールス。
先週は Eva の DVD-BOX が 2 位。今週は 3 位。 33,830 円の DVD-BOX がなんでこんなに売れるのかしら?
トップというのは購入(予約) タイトル数じゃなくて、 売上額で決めているのかしら?

2/10 (月)

[Movie] 第23回 ゴールデン・ラズベリー賞の候補発表

アカデミー賞よりも盛り上がる ゴールデン・ラズベリー賞(ラジニー賞)の 候補が発表された。

昨年は PLANET OF THE APES が最低リメイクシリーズ賞、
最低作品賞にドリブンパール・ハーバーがノミネートされるなど
白熱した展開だったが、 今年のノミネート作品は見たことのない候補ばかりだ。
大コケした大作が少なかったからかしら?

あと、 本家(?)アカデミー賞にはギブリの 千と千尋の神隠しアニメーション部門にノミネートされたようだ。
となりの山田くん も 時期を外さずがアメリカ公開されていれば、 ラジニー賞にノミネートされたのになぁ...

P.S.

ラジニー賞の授賞作品・受賞者の発表・受賞式は 3月 22日。 言わずと知れたアカデミー賞の前日だ。
しかし、Igノーベル賞といい 最近のマスコミは平気でキワもの取り上げるように なったなぁ。
やはり、1億総おたく化時代?

参考


2/9 (日)

[Compiler] フリーの FORTRAN コンパイラの実力は如何に

x86 用の FORTRAN を必要としてるため、 まずはフリーの g77、 Open Watcom FORTRAN77(以下 OWF)を チェック。 SPEC CPU2000 ベンチマークの中から FORTRAN77 の 168.wupwise、171.swim、172.mgrid、173.applu、200.sixtrack、301.apsi をコンパイルして性能比較を行ってみた。

コンパイル & テスト環境は Pentium III 1GHz x2 / PC133 1GB / Windows 2000 Pro マシン。
SPEC に登録された 似たような環境を比較のため加える(base 値のほうで比較)。

コンパイラ名オプション
g77 cygwin 2.95.3-5 -O3
Open Watcom FORTRAN77 ver1.0 /FP6 /OX /OH /OL+
Intel Fortran 7.0 -Qipo -QxW -O3 -G6
Intel Fortran 5.0 +FDO: PASS1=-Qprof_gen PASS2=-Qprof_use
-QxK -Qipo -O3 +FDO

コンパイルを行ったところ OWF では、 200.sixtrack がコンパイルできず、 301.apsi の実行結果が不正となった。 また空白の出力の仕方が変で、 そのままではリファレンスの出力結果と一致しない。
g77 は 6 ベンチマークところ、コンパイルできた。 ただし、 301.apsi は単体でベンチマークを走らせる方法が分からず未計測。

で、結果だが

Benchmark g77 Watcom Intel 7.0 Intel 5.0
168.wupwise 203 186 379 401
171.swim 139 235 281 334
172.mgrid 67 106 235 215
173.applu 123 163 201 251
200.sixtrack 104 N/A 141 169
301.apsi 216 N/A 298 431

動作した 168〜173 だけ比べると OWF の方に軍配が挙がるが、 商用の Intel Fortran と比較するとしょんぼりな結果だ。
だが、それ以上に g77 の 172.mgrid のスコア 67 はいただけない。 SPEC CPU2000 のスコアは、 基準マシンの Sun Microsystems の Ultra5_10 workstation (UltraSPARC I 300MHz) で スコア 100 となるように調整されている。
Pentium III の 1GHz が、 UltraSPARC I の 300MHz に負けるなんて...

追記: 2/11

g77 で 200.sixtrack も実行。スコア 104 を得る。
かろうじて Ultra5_10 に勝った。

追記: 3/13

Intel Fortran 7.0 での結果を追加しておく。
フィードバック最適化(FDO)は利用していないので、 FDO を使った Intel 5.0 の結果に全般的に負けている。
172.mgrid の結果だけは逆転しているが、 これが 5.0 → 7.0 とバージョンアップした 効果だと思われる。


2/8 (土)

[Java] Java のベンチマークっていくつぐらいあるんだろう?


(この日記の内容は このページ に移動しました)

2/7 (金)

愛媛からデコポン

愛媛の友人 takeda 氏からデコポンをいただいた。

デコポンというのが何か知らなかったが、 ポンカンと清見タンゴールの交配によって 生まれた人造 柑橘類だ。

さっそく食べてみる。 見た目はポンカンだが、、、、
甘い!! そして酸っぱい!! 後味が独特だ。

デコポンの箱
デコポン
デコポン

ついでに、デコポンについて調べてみる。
ヘタの部分がデベソのようにデコなっているのが特徴らしいが、 もらったデコポンはそれほどデコがない。
デコがあってもなくても味は変わらないそうだ。

参考


2/6 (木)

[Prog] 形態素解析 v.s. N-gram

英語のような単語と単語に空白を入れる分かち書き則を持つ言語と違い、 日本語や中国語のようなべた書きされる言語は語と語の間がはっきりしない。 そのため検索を際にどうマッチングをとるかが問題になってきた。

例えば、

きんたますかっとないふできる

の場合、 ナイフで切るのがマスカットなのか、 そうでないものなのかは大問題だ。
それによって検索語にヒットするかどうかも変わってくる。

これまでべた書き形式の言語を検索をやる場合、 言語の文法と単語辞書をもとに、 語と語を切り分けてから検索を行おうとする形態素解析派と、 語と語を切り分けるのは諦めて前後の字の繋りだけを見て検索を行おうとする N-gram派の 2 大勢力があり 互いに優劣を競いあっていたようだ。

ところが 国立情報学研究所が 主催する検索エンジンの評価型国際会議 NTCIR (NII Test Collection for Information Retrieval Systems:エンティサイル) で N-gram 派だった UCB が 形態素解析派に寝返ったために、 形態素解析の方に軍配があがりそうな雰囲気だ。

もっとも Google がアジア言語(日本語、中国語、韓国語) の Web ページの解析に 形態素解析を使っているので、 コマースの分野ではすでに決着がついてしまっているかもしれない。

P.S.

フリーの日本語 形態素解析システム 茶筌(ChaSen) (chasen-2.2.9 + ipadic-2.5.1) によると、

きん    キン    きん    名詞-固有名詞-人名-名
たま    タマ    たま    名詞-一般
すかっと        スカット        すかっと        副詞-一般
ない    ナイ    ない    形容詞-自立     形容詞・アウオ段        基本形
ふ      フ      ふる    動詞-自立       五段・ラ行      体言接続特殊2
できる  デキル  できる  動詞-非自立     一段    基本形

だそうである。 すかっと・ない・ふ・できる。

参考


2/4 (火)

[MyWeb] Web に情報を追加

書き貯めていたものを Web に追加。

いろいろ Web に載せれそうな種はあるのだが、 公開できるほどまとまった文章にするのは億劫だ。


2/3 (月)

通報すますた

うちのサイトには あいもからわらず色々な攻撃が繰り返されている。
いい加減に面白がるのにも飽きてきたので、 今年になって 80/tcp へのアタックを行ってきた
nimda 系ウィルスに感染した ホストを 3 件ほどプロバイダに通報した。
プロバイダはどのような反応を返してくるかが楽しみ。

追記: 2/8

昨日(2/7)の 19:33 にまたアタックがあったのでこれも通報。
でも、どこからも何の反応も返ってこない。


2/2 (日)

[Tips] LaTeX で URL を書くには

最近は情報処理系の大学生でも LaTeX を使う人はあんまりいないようだ。
資料を書くときは大概 Word を使ってしまうらしい。

筆者は清く正しく LaTeX を使い続けているが、 LaTeX には URL を書く記法がないのが不便だった。 しかたなく \verbで囲ったりしていた。 ただ、そういう時は大概だれかがスタイルファイルを作ってくれているもので、 url.styhtml.sty、 のようなスタイルファイルを発見。

url.sty は \url コマンドによって URL を簡単に書けるようにする。 括弧内では %、#、^、~、>、< もそのまま使用することができる。

\usepackage{url}

\url{http://www.nminoru.jp/~nminoru/}

参考


2/1 (土)

[時事] スペースシャトル コロンビアが爆発

知り合いに電話を掛けている最中に スペースシャトルの爆発の報が入る (現地時間 9:00、日本時間 23:00)。


先月の日記(2003年01月) 今月の日記(2003年02月)
2002 | 10 | 11 | 12
2003 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12
2004 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12
2005 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12
2006 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12
2007 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12
2008 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12
2009 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12
2010 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12
2011 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12
2012 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12
2013 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12
2014 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12
2015 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12
2016 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12
2017 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12
2018 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12
2019 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12
2020 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12
2021 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12
2022 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12
2023 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12
2024 | 1 | 2 | 3 | 4
ホームページ | 最新のコメント50
インデックス: 食べ歩き | Java | プログラム | UNIX | 画像
最新の日記へのリンク | この日記ページをはてなアンテナに追加 この日記ページをはてなブックマークに追加
はてな ダイアリー アンテナ ブックマーク ブログ
Twitter | mixi | Facebook | slideshare | github | Qiita


Written by NAKAMURA Minoru, Email: nminoru atmark nminoru dot jp, Twitter:@nminoru_jp