Subscribed unsubscribe Subscribe Subscribe

SE Can't Code

A Tokyo based Software Engineer. Not System Engineer :(

Androidアプリの特徴ワードをGooglePlayから抽出する.

Androidアプリの特徴となる単語を抽出するためにGooglePlayサービスに対してスクレイピング処理を行う。 Androidアプリにはパッケージ名というアプリを一意に識別する値が文字列として与えられており、GooglePlayのプラットフォームに対するクエリにパッケー…

GoogleCustomSearchAPIでカテゴリー辞書を自動生成。

ナイーブベイズの学習用途として、まずはGoogleCustomSearchAPIを利用して文書カテゴリーを定義づける単語辞書を作った。最初は自分の手で静的に一つ一つ作っていこうとしたけれど、実際に辞書を手で作っていくと膨大な時間がかかってしまうことになり、僕は…

Tips, about Cookie.

WebにおいてCookieは重要な概念なのでTipsとして残します。 Cookie CookieはWebブラウザがキャッシュデータを保持するためのHTTPの機能。Cookieを使うことで一度アクセスしたwebページに対して、再度アクセスする度にキャッシュ情報から利用者の識別がされ、…

Tips, REST

RESTについて。 REST(Representatinal State Transfer) クライアント/サーバから派生したアーキテクチャスタイル*1。RESTはクライアント/サーバアーキテクチャに制約を加えていくことで、Web全体を統一したアーキテクチャを実現しており、Webサービスを設計…

サクっとRot13を実装する

ノロウイルスが治り、3日遅れながらも今年初出社いたしました。 病み上がりなので、GAEとPythonでROT13ストレッチをします。 ROT13(rotate by 13 places) 文字を任意の個数ずらすシーザー暗号の一種で、暗号化と復号化が同じ仕組でできる。 13字ずらす方式…

PythonでPageRankを実装する

この世界で最も有名なプロダクトの一つであるGoogleの検索エンジンですが、その検索エンジンを実現しているPageRankというアルゴリズムについてPythonで実装したいと思います。 PageRank Webで文字列の検索をかけると最も適したWebページが検索結果の上位に…

あるshellshockの日の職場では。

今年はどういった年だったかと聞かれれば、脆弱性が発見される年だったなぁという印象がある。特にshellshockが発見された日の朝は、はてブからいろいろなところが騒いでいたので、内容を見ても「おお、これはヤバいな、、これは会社もてんやわんやだろうな…

ReCAPTCHAについて

Webサイトに登録する際、読みにくい文字が画面上に表示され、その文字を打ち込むことで人間であることを証明するReCAPTCHAという仕組みがある。これはbotにより大量の自動アクセスを防ぐセキュリティシステムであり、今日の多くのwebサイトで見かけるもので…

SSHについての備忘録

AWSでサーバ立てたので、接続を試みる中でSSHについてちょっと調べたので、 簡単にメモ。まずは鍵の作成。 $ ssh-keygen -t rsa -C "email@~.com"結果、RSA型式の鍵が出来上がる。 ここで基本情報技術者を勉強していた時の記憶から疑問。 「DSA型式ってなか…