ラベル Google の投稿を表示しています。 すべての投稿を表示
ラベル Google の投稿を表示しています。 すべての投稿を表示

2010/02/14

Google Buzz は Google Wave の布石か

おはようございます。バズー!とかみんなで言ってもTwitterは落ちないから大丈夫! (「バルス!」とそんなに似てなかったか ...)

先日Google Buzzが公開されて、早速使って見ている。

地図情報との連携があるのでfourspace対抗かと思ったんですが、一般的にはTwitter対抗と見られていますね。

ユーザーを探すのが苦労するね。アドレスを知ってないといけない。いやもちろんTwitterだって同じなんだけど、メールアドレス公開することになるからみんなそこで躊躇してるんだろう。またメールを公開するということは、一緒に記述されている姓、名も公開されることになる。これは盲点で、私も以前エキブロ仲間のイベント用Googleカレンダーを共有するという時に初めて気付いた (→ Exbloggers カレンダー - 昨年9月以来新規投入イベントはありませんが)。

そんななか、フォロー数を一気に80まで増やしてみた。フォローされると、相互フォローを促すような表示が出るんだもの。なんかmixiのマイミク申請みたいで、相互フォローしないといけないような気になる。

で、その結果、カオスです。興味のない情報が並んで、その中に興味を引かれるものがあるのだけど探すのに一苦労。

また、投稿にコメントができるという点も、一つの投稿がとる縦幅を広げていて、一覧性を悪くしている。コメントは閉じられていれば良いのだけど、前回見た以降にコメントがあるとそれらは展開されて表示される。そして新しいコメントが加わると元記事の並びがまた上の方に上がって来て、何度も同じ記事を見ることになる。

これは鬱陶しいと思ってたが、それを評価する意見もある。

Yuuka Lingさんの"twitterでは「1200人も」フォロワーがいるのに、つぶやいても何の反応もない件。 "へのコメント
高橋伸行 - twitterの場合は@で返すと、どの発言に対する返事か分からないことがあるし、
時間が経過すればするほどこの問題は拡大していく。
だけどbuzzの場合はどんなに古い話題でも的確に繋がるから返事がしやすい。
投稿ごとにミュートすればいいみたいではあるが、ミュートすると新しいコメントがあったことが分らなくてミュートした効果が分らないかも?

確かにツイートは何に対するリプライか分りにくいけど、分らないもので特に興味が持てなければスルーすれば良い。こちらは元の投稿に興味がなくとも見せられるからなあ。フォローしていない人のコメントも入るというところも違いが生じるところ。

同じ発言でも、フォローしている人の発言とそうでない人の発言では、重みが異なるし意味が異なる。と思っていたら、ちょうど昨日やってた津田大介と坂本龍一の対談ライブストリームでたまたま聴いた部分で同じことを言っていた。

Twitterではフォローしている人のリプライ発言が、自分のフォローしていない人に対するものだった場合にはタイムラインに上がって来ないという仕様も、今考えてみるとなかなか良い。自分で、このリプライはみんなに見て欲しいと思ったら、@マーク付きIDが先頭にならないように、さらに他の人も話題が分るようにキーワードを含めた形で文章を書いて、投稿すればよい。コミュニケーションを意識しつつそれなりのコントロールができる。

Twitterではタイムラインでは上がって来ないけど、その人の場所へ行けばその日との発言は全部見ることが出来て、その人が誰と対話しているかを知ることができる。その人の考え方を知ることができる。一方、Google Buzzではその人がどこにコメントしているか分らない。それは旧来のブログやSNSでも同じだけど。

こういうと、やはりTwitterは、人に視点をおいて、人と人をつなぐメディアなんだと分る。
一方、Google Buzz は? 先程のYuuka Lingさんのコメントにこんなのがあった。
KOZO HIRATA - 今はTwitterよりBuzzのほうが、ゆるくていいし、古い話題でも過去の経緯が分かりやすいです。
フォロワーが多ければ多いほどTwitterでは、発言に気を使いますが、こちらは、テーマが決まっている分、発言はスレッドの中身のみを考えればいいので楽です。

掲示板のスレッドなんだね。人よりも「話題」に視点をおいている。

2チャンネルの掲示板のスレッドは誰でも立てられるけど、それは誰でも見られる場に課題提起をすることだ。一方 Google Buzz なら自分をフォローしてくれている人しか見ていないだろうから、話題を切り出すハードルが低い。そういう意味では、その話題もその人にリンクした側面が強くなるため、旧来の掲示板よりは「人」に重心を移しているとは言えるのだけど。

で、ようやく表題に書いた話題にたどり着く。

このような半分閉じて半分開いたような話題空間は、今までなかったんじゃないかな。いやもちろん掲示板を作るサービスはいくつもあって、それを使って参加したい人にだけ知らせるという方法はあったのだけど、参加したい人に知らせるのも強制しているようで気が引ける。自分の周りで、参加したい人にだけ参加してもらいたい、そういうニーズにぴったりあったものはなかった。

本来そこは Google Wave が狙っていたところではないかと思う。でも Google Wave は、招待制をとったことで参加者が少ないし、誰が参加しているかも分りにくい状況が続いている。また、どこで話題が立ち上がっているかも把握できない。私もいろいろ試してみたが、最近放置状態だ。

そこで GMail のアカウントを持っている人なら誰でも使えて、GMail でのつながりのある人は自動的にフォロー関係を持つように設定して始めたのではないかと思う。機能面でもGoogle Waveのような多機能からおとしているのではないかと思う。今はGoogle Waveのような履歴は残らないが、自分が書いたコメントは書き換えできる。きっと今後は、議論が荒れるような事態が起こるようになって、履歴が必要になる。そうしたら満を持してGoogle Waveのお出ましだ。

というストーリー。穿ち過ぎ?

2009/01/02

MapReduceってこういうことか

こんにちは。PigeonRank 作成作業員です (ウソ)。

Googleでは、並列計算の枠組みMapReduceを使って、ページのインデックスを作ったり、ページランクを計算している。

ページのインデックスを作るというのは、
・Webページ群の各ページにある単語 (実際はNgram) の並びを抜き出して、
・単語から、その単語をもつページ群を割り出す (これを保持する)
ということ。

また、ページランクを計算する時には逆リンクを求める必要がある。あるページからリンクがはってあるページ群の逆で、あるページへのリンクをもつページの集合。これはWeb全体を見なければ分らない。これを被参照ページごとに行うのではなく、まとめて行う。
・Webページ群の各ページにあるリンク先を抜き出して、
・リンク先ページから、そのページへのリンクをもつページを全て抜きだす。

これらの共通点は、行列の計算をそれぞれの軸で行っているということ。すなわち、
インデックス: ページ軸 → 単語ベクトル、単語軸 → ページベクトル
逆リンク: リンクページ軸 → 被リンクページベクトル、被リンクページ → リンクページベクトル
[補足] 実際はベクトルではなくハッシュ表なのだが、ここではベクトルで説明する。

この最初のステップをMapで、次のステップをReduceで並列計算する。その間にMapの計算結果 (ベクトルのベクトル = 行列) をスライスしてReduce用の計算機に分配するShuffleのフェーズが入る。

図解にするとこんな感じ。
アニメーションをつけたPowerPointプレゼンテーションを置きました。



次に、インデックス抽出の事例をここにあてはめてみる。

ここでは単純化のため、形態素解析で分割された文字列を単語として扱うが、Googleでは任意の文字列で検索できるのでNgramを用いていると考えられる。もちろん英単語をカタカナで検索できたりするということは単語がわかっているということなので、形態素解析も併用していると考えられる。また「バイオリン」でも「ヴァイオリン」でも検索できるので表記違いもあわせてインデックス化しているかもしれない (検索時に展開する方法もあるのでGoogleが実際にどちらを採用しているかは分らない)。

1) Map: Webページ群をプロセッサの数に応じて割り当てる。WebページURLとそのコンテンツ (テキスト) を入力として、単語の並びを抽出する。ここでは存在することを●で示しているが、個数を記録しておけば、その単語を多く含むページを優先させる処理が可能になる。

2) Shuffle: Mapの結果をベクトルの要素ごとに決めたプロセッサに分配する。ここではベクトルと書いたが、ある単語を処理するプロセッサが特定できれば良いので、実際はハッシュを用いている。

3) Reduce: 各単語ごとの処理を行う。ここではその単語を含むページ (URL) のリストを作成する。Mapの段階で単語の個数を記録していた場合は、URLと単語個数の対のリストを返す。あわせてURLの個数を計算することで、その単語がどれだけ多くの文書で使われる一般性の高い用語なのかの尺度DF (Document Frequency) を得ることができる。

アルゴリズムによってはMapとReduceの組み合わせではなく、Mapの結果は既に入力として持っていてReduce処理だけ必要というものもでてくるだろう。またアルゴリズムによっては1段のMapReuceでは足りず、複数回適用する必要があるものも出ると思われる。

以上、誤解等ご指摘いただければ幸いです。

参考文献
Radium Software Development: MapReduce
  -- 「フィルター」と「アグリゲーター」の2段階から構成されると考える
原論文 (すみません読んでません) MapReduce: Simplified Data Processing on Large Clusters

2008/12/15

Technoratiで自分をリンクしているブログがわかる

もしかして常識だった?

Technoratiを見ていたら

Search / 33 blog reactions to ryokan.exblog.jp

というページがあった。私のブログへのリンクを含んだもののリストのようだ。もちろんサイドバーのリンクリストに含めてくれている人や、私がトラックバックを送ったところもあるのだけれど、トラックバックを送らずに言及している記事もある。

例えばこれね。

Oggi come oggi 2008-11-13 Google 風邪を読む
すく★ろじ 2008-07-18 [雑記]「けまらしい」とは

1年くらい前のインデックスも入っているようだ。でも私がトラックバックを送ったところはもっとあるはずなんだけどな。トラックバックが多く来るところだったり、記事の更新が多いところだと消えるのも早いのかもしれない。

URLに、
http://technorati.com/search/xxx.exblog.jp
(日本語サイトhttp://www.technorati.jp/でもOK)
と入れればよいので、ほかの人のブログでも試してみたのだけれど、
http://technorati.com/blogs/xxx.exblog.jp?reactions
にリダイレクトされるところもある。何が違うのだろうか。ユーザ登録とかしたから?

同様のことが
link:xxx.exblog.jp
でGoogleブログ検索 (http://blogsearch.google.com/) するとできる。こちらの方がたくさん見つかる (とはいえかぶっていないいないものもある)。もちろんGoogleの普通の検索でもできるのだけれど、ブログ検索は普通の検索のサブセットじゃないようだ。

それからGoogleで
related:xxx.exblog.jp
で検索すると同じ話題を扱っているブログがいろいろ見つかる。なぜか私の場合はほとんど「松井冬子」をとりあげたものだった。

2008/12/09

Google Friend Connectってどうかな?

おはようございます。グ〜!って流行みたいですね。

先日こんなニュースがあったので、
SNS機能をサイトに追加する「Google Friend Connect」、いよいよ利用可能に (RBB Today 2008年12月5日)

作ってみたよ!
Exblog Friends

GoogleMailアカウントを持っている人はJoinしてみてね。

追記: ほんとうはOpenIDなのでYahooIDなどでもいいはずなのだけど、登録する方法がないようですね。自分のIDは他所で使って良いけど他のIDはGoogle様の領域を侵すことは許さん、って感じでしょうか。

追記:サービス終了になってますね。→ ITmedia news 2011/11/23 Google、終了予定サービス第三弾 「Knol」や「RE
Google Friend Connect 
 Google Friend Connectは、Webサイトにユーザー登録やメッセージ投稿などのSNS機能を組み込めるようにするWebオーナー向けのサービス。2008年5月にスタートした。2012年3月1日に、同社のブログサービスBlogger以外のサイト向けのサービスを終了する。Googleは、現在Friend Connectを利用しているWebサイトに対し、Google+ページを立ち上げてGoogle+バッジをWebサイトに設置することでコミュニティーを形成するよう促している。

2008/11/13

Google風邪前線予報

こんばんは。急に寒くなりましたね。昨日はセーターを今季初めて着ました。

Google 急上昇ワードのトップに、"flu tracker"ってあった。

これね。

Google.org Flu Trends (Google.orgってのもあるんだね)

検索語の動向から、インフルエンザの流行が分るそうだ。通常の予測よりも2週間早く流行を予測できるらしい。

詳しい説明はここ → How does this work?

きっと、みんな「発熱」とか「悪寒」とか「咳」とか「タマゴ酒」とか「バナナ」とか検索するんだろうね (英語で)。

ん、まてよ。こうやってみんなが"flu tracker"のことをブログに書いて、関連語を記事中に記載して、ついでに検索で調べてみるか... なんてやってみたりすると、今年の予想に狂いが出たりするのではなかろうか。

2008/08/16

ゆるいのも日本の文化だろ

おはようございます。伊能忠敬です (ウソ)。

【絵文録ことのは】松永英明さんの「グーグル・ストリートビューに儀礼的無関心を求めるのは筋違い」に対して、私は
エクステリアの「あるべき論」はわかるが、日本人の少なからずの人が「エクステリア」=「金持ちの道楽」と思っている。また、Webの世界の「あるべき論」を適用するのも間違い。

というコメントともにブックマークした。これに対して松永さんは次の記事「グーグル・ストリートビューは、やっぱり気持ち悪くないと思う」で、
ここで使った「エクステリア」という用語は、単に建築物の「内と外とさらに外」みたいな区別を厳密化させるために用いたものであって、たとえばアパートのベランダなども含めることは本文で書いたとおり。
つまり、外から見られる部分について、実際に(日本人であろうと何国人であろうと)「私的領域に属しながら、外から見られる」ことを(おぼろげながら)自覚しているはずだ、という話。

と書かれている。それは分って上で書いているのだけれど、ブクマコメントでは十分な説明になっておらず誤解を招く。ここではもうすこしまとめてみたい。

概要:良し悪しはともかくとして、私的領域と公共領域の境界をふくめて、ゆるいことは日本の文化だろう。グローバルスタンダードに合わせなければならないのだろうか。

ここで「文化」というのは、「芸術」とか、保護すべき「伝統」ではなくて、「共通の価値観」という意味。日本人の好みが変わって行けば変わって行くもの。多くの人が電車の中でケータイ通話が気にならなくなれば、車内放送での呼びかけもポスターもなくなるよ。

実は私も最初はストリートビューは単純に面白いと思った。今は大都市しかないし、大都市の中で知っているところは繁華街くらいなのでそういうところしか見ていなかったから。

それが、松永さんの記事でもとりあげられたhiguchi.com樋口さんの「Google の中の人への手紙 [日本のストリートビューが気持ち悪いと思うワケ]」という記事を読んで、なるほど単純に面白がってはいられない問題だなと思った。この樋口さんの記事は、単なる違和感ですませるところを、文化的背景から説明しており、良い記事だと思う。

松永さんの記事はそれを理解した上で否定している。「見て見ぬふりをしてほしい」というのに対して、「実際にもともと見えていたものなのに、それに無頓着過ぎたのだ」というのでは妥協点はないだろうな。

まず、「見える (see) 」と「見る (look at)」では違うと言うことをあげておこう。Googleストリートビューは「見える 」と「見る」に変える装置だ。

ここでやっと「エクステリア」の説明に入れる。もう一度松永さんの認識をあげる。
単に建築物の「内と外とさらに外」みたいな区別を厳密化させるために用いたものであって、たとえばアパートのベランダなども含める。

多くの人はこの意味での「エクステリア」は理解できるだろうし、「エクステリア」という言葉は使わなくても外から見られている空間であることは認識しているはずだ。そこを私は、
エクステリアの「あるべき論」はわかる

と書いた。

その上で私は、
日本人の少なからずの人が「エクステリア」=「金持ちの道楽」と思っている。

と書いた。見えるのは分るけど、それを写真に撮られて全世界に公開して恥ずかしくないというレベルまで持って行くだけの余裕は金銭的にも時間的にもない、勘弁してよ、ってことだ。

「恥ずかしくない」というところがポイントで、高級住宅街にぽつんと自分の家があったら恥ずかしいけど、周りもみんなそんな家だし、おっさんがステテコのまま歩き回っているようなところなんだから、「見て見ぬふりをしてほしい」ってことだ。

そんな「ゆるさ」を日本人はもっていると思う。それを一気にグローバルスタンダードに合わせることを強いるのがGoogleストリートビューだろう。

「Webの世界の「あるべき論」を適用するのも間違い」も同じ。これは無断リンクをいやがる人達と同一視したものだが、Webでの公開はもともとフラットで全世界に公開されていたものであって、自宅をそこに来る人に見られているのとは訳が違う。

「金銭的に余裕がない」と書いたが、家を持つ金があるんだったらそのくらいの余裕はあるだろ、エクステリアのメンテナンスまで配慮することを含めて家を持つとことだろ、という指摘はあるかもしれない。でもね、やっと買った家だってGoogleカー (高木浩光さんは「Googleカー」と書いていたw)から下手したら窓の中まで見えるくらいの敷地に建てていて、アメリカの住宅地や農村とは違う。借家だってアパートだって同じ。洗濯物をベランダに干さざるを得ない。それにやっぱり日本人はいくら貯金があっても余裕がないんですよ。まだ読んでいないけど、吉村 葉子 「お金がなくても平気なフランス人 お金があっても不安な日本人」に書いてある (はず)。

これからGoogleストリートビューはアジアの他の国やアフリカにも進出してくるんだろ。もちろん価値観も違うので抵抗もかえってすくないということはあり得るけど、日本以上に貧しいところが多い。アンカテessaさんは、「グーグルにNO!と言えるニッポン」
このエントリは、相手が違う文化、違う常識を持っていることを前提としていて、そういう相手に理解してもらえるように説明している所が素晴しいと思ったからです。

こういう形で異議をとなえることは、日本の重要な責任ではないかと私は考えています。
と書かれている。

Googleには全世界で同じサービスを提供するという方針とともに、それぞれの文化を尊重する姿勢はあると思う。また、"evil"にならないことを宣言しているし (これをGoogleは"evil"でない = Googleがやっていることは正しいと思っている人も多そうで心配だけど)。今回はそれに気づかなかっただけだと思うので、何らかの形で改善することを望みます。少なくともカメラの高さを人の目の高さにすることくらいはできるはず。

2008/04/19

時事クイズみたい

おはようございます。はなけろです (誰だそれ)。

先日始まったGoogle 急上昇ワード入れてみました。

コトバをリアルタイムにキャッチ ! Google 急上昇ワード (Google Japan Blog 2008 年 4 月 15 日)

ちょっと前の結果なんですが、他と比べて集計期間を短くとっているようで、知らない単語が多く出てきます。知っている名前でも、なぜいま急上昇なのかニュースを常に追っていないと分らない感じです。まるで時事クイズみたいになります。

「南海電車」は貝塚市の産廃工場の火事というのは分るのですが、その他はすぐには分りませんでした。「はなけろ」はライブドアのネットアニメらしいです (→ サイト - 音が出ますので注意)。

今は「リノベーション」って上がってきてるんですが、さっきテレビでやってました。調べているうちに変わっちゃうからいつまでも調べ続けなきゃいけない感じ (笑)。

2005/10/30

人生、宇宙、すべての答え

こんばんは。スカイネットです (ウソ)。

スラッシュドットジャパンを見ていたら、「Google電卓日本語版が機能強化」という記事が。「日本語文での入力」と「日常的な単位換算」が出来るようになったということで、「4/3*π*地球の半径の3乗」などと入れると答えを出してくれるそうです。

その中で気になったのが以下の記述
ちなみに、日本語でも「人生、宇宙、すべての答え」を答えてくれます(笑)。
リンク部分をクリックすると「42」という答えが出る。

何これ? その答えの下に「Google 電卓機能について」って書いてあるので、クリックしてみた。

でもまだ答えはわからない。解説の中に、「詳細な説明 (英語) を参照してください。」ってあるので、そこもたどってみた。

まだわからない。というか、ここで手がかりが途絶える。体型はオヤジ、頭脳は小学生のウエダさんとしては途方に暮れ、先ほどの計算結果に戻ってみた。計算結果だけでなく、Web検索結果もあり、最初にWikipediaの記述があった。
生命、宇宙、そして万物についての(究極の疑問の)答え(せいめい、うちゅう、そしてばんぶつについての(きゅうきょくのぎもんの)こたえ、原文は定冠詞つき大文字でthe Answer to (the Great Question of ) life the universe and everything) は、ダグラス・アダムズのSF小説『銀河ヒッチハイク・ガイド』に登場する答えで、その値は 42 である。
やっともとがわかりましたね。

『銀河ヒッチハイク・ガイド』はずっと昔に読んだんだけどなあ。すっかり忘れてます。

もう一点。スラッシュドットジャパンで、「(笑)」と書いてあるのが気になる。これは、英語版でそう出る、ってことですね。という訳で、英語の計算もさせてみる。英語は上記Wikipediaにあるので、それをそのまま入れてみましょう。...

これそのままでは出ませんが "answer to life the universe and everything" だったら42って出ましたよ。

全時代および全世界において2番目に凄いコンピュータ、ディープ・ソートでも750万年もかかる計算の答えを一瞬に出すGoogle、恐るべし。

追記: 「はてな」でDeepthoughtという人が質問していました。自分で750万年かけて考えろ。

クリックすると答えがわかります。