Subscribed unsubscribe Subscribe Subscribe

SE Can't Code

A Tokyo based Software Engineer. Not System Engineer :(

TensorFlow whitepaper、読んだ.

一応仕事で機械学習を扱ってるエンジニアなんだけど、TensorFlowについては全く触っていなくて、なんとなく去年あたりから世間が騒いでいたのと、機械学習の分野でトップに君臨している(と思われる)Googleが作ったということで、かなり凄いんだな、という…

Neural Network.

In coursera, I learned the Neural Network that is a data structure and machine learning algorithm that mimics brain. This is developed from simulation of network of brain neuron. You suppose example of computer vision, you are learning to …

Solving the problem of overfitting.

As Cousera's Machine Learning course, I learned regularization to avoid overfitting. There are Underfitting and Overfittng in machine learning. Underfitting refers to a model that can neither model the training data not generalize to new d…

Logistic Regression.

I'm gonna note down here about Logistic Regression because I learned it again at Cousera's Machine Learning course. In machine learning, Logistic Regression is often used for classification. It measures the relationship between the categor…

Gradient Descent and Normal Equation.

Learn again linear regression with multiple variables. I'm gonna note down how linear regression can be extended accommodate multiple input features in here. Especially, I'm gonna talk about Gradient Descent and Normal Equation. These are …

Infrastructure's machine learning.

I guess that you wanna detect anomaly from server logs. Using Jubatus, you can create reporting system that check per anomaly of access log of web site from Apache2. Using Apache2 Fluentd Jubatus Python First, Start Fluentd with option of …

Stanford University「Machine Learning」の受講を始めた.

MOOCはずっとUdacityで受講していたが、Machine Learning | Courseraがかなりオススメだといろんな人に言われたので受講することにした。 シラバス眺めてみたが、前半は線形回帰から後半はニューラルネット、異常検知までまるっと網羅しているみたいなので、…

Intro to Machine Learning at Udacityを修了した.

Udacityの機械学習コースの「Intro to Machine Learning」を修了した。内容自体は割と簡単で、機械学習を勉強すると避けては通れない数式は一切出てこなくて、機械学習モデルの概念を実際にScikit-Learnのライブラリを使ってコード書きながら学んでいく形式…

生体センサデータをHackする.

PebbleTimeRoundがようやく届いた。Pebbleプロダクトの中で円形型のデバイスで、見た目が通常の時計風でかなり良い。ちょっと前に会社で買ってもらったFitbitと合わせて、これで生体センサデータを収集する下地は整えることができたので、人間の状態をセンサ…

サポートベクターマシンを使って顔識別.

Scikit-Learnのサポートベクターマシンと“Labeled Faces in the Wild”のデータセットを用いて顔認識を行った。パラメータチューニングについては、GridSearchCVを用いている。GridSearchCVは設定したチューニングパラメータを設定し、それぞれのパラメータパ…

ダイクストラ法で最良優先探索。

グラフにおける単一始点の最短経路をダイクストラ法で求める。 ダイクストラ法は、辺の重みが全て同一の非負数の場合にグラフ上の2頂点間の最短経路を求めるアルゴリズムである。 擬似コード Shortest disntances from V: # V is a Top Node. dinstances to …

2015年の目標を再設定.

今年に入って仕事の内容が大きく変わったので残り三ヶ月くらいだけれど、2015年の目標を再設定する。 というか未だにどこから手をつけていけばいいのかがわからなくて、暗中模索でいろんなとこに手を出してしまっているので整理したいという意味が大きい。僕…

完全情報最尤推定法による欠損値補完.

仕事の関係でGraphClusteringについての論文を漁っていたのでここらへんの勉強が止まってしまっていた。いやまさか社会人になってから英語の論文を漁ることになるとは思っていなかった。ここらへん最近改めて思うのだけれど、僕は文系学卒出身の人間なので、…

データ解析における欠損値対応フロー

データ分析プロセスの中の欠損値対応についてまとめる。 分析をするデータには大抵欠損値が存在しており、多くの統計解析や機械学習の手法では欠損値が存在していないことを前提としているため、欠損値を取り除いてあげるか、補完してあげるかのアプローチを…