doop

Janome

Word2Vecでベクトル分析してみる

前回の続き。Janomeで単語に分割した文章を使って分析してみる。出現頻度の多い単語は何かを調べるくらいなら、前回紹介したAnalyzerでも調べられる。TokenFilterにTokenCountFilterを指定すると、出現回数の多い順...
Janome

Janomeで形態素解析してみる

前回に引き続きPythonネタ。最近始めた業務でちょぃちょぃ話題になるのが「テキストマイニング」やら「自然言語解析」。話には聞いて事あるし、理屈はわかっているつもりだけど、実際にはどうやるんだろ?と思い、試してみた。元々興味もあったしね。や...
Python

SQLのこれって、Python+Pandasだとどうやるんだっけ?(後編)

前回の続き。「SQLのこれって、Pandasでどうやるんだっけ???」を、SQLと比較しながら解説していきます。なお、データの事前準備のやり方などはSQLのこれって、Python+Pandasだとどうやるんだっけ?(前編)を参照してください...
Python

SQLのこれって、Python+Pandasだとどうやるんだっけ?(前編)

前回に引き続き、Pythonネタ。データ分析をする時にPandasを使うと便利ってのは知ってたんだけど、「SQLのこれって、Pandasでどうやるんだっけ???」と、よくなるので備忘録的に。ちなみにPandasってのはデータ解析用のPyth...
Django

PyCharm Community で Python + Djangoの開発環境を構築する方法

仕事が忙しかったり、転職したり色々あって、久々の更新。新しい職場でPythonを使うことになりそうなので慌てて勉強中。Pythonの開発環境として便利そうなPyCharmを使おうと思ったんだけど、無料版であるPyCharmCommunity...
たわごと

サーバー再構築ではまったことの備忘録(ブログ復活しました)

原因はよくわからないけれど、サイトが見られない状態が続いていました。sshでサーバーにログインできなかったんで、おそらく何かしらアタックされてサーバーを壊されちゃったんでしょう。そんな状況は知ってはいたものの、忙しさにかまけて復活がのびのび...
JAVA

キャッシュを有効にしつつ、cssやjsファイルの変更を確実に反映させる(JavaとJSP編)

このブログで唯一アクセス数を稼いでいるキャッシュのお話。前回はPHPだったけど、今回は必要に迫られてJSPとJavaで。目的は前回と同じ。cssやjsファイルを更新したのに、キャッシュのせいでうまく反映されないイライラを解消するためのTip...
WordPress

しばらく放置していたら、サイトが改竄されていた

夏くらいから仕事が忙しくって、しばらくブログを放置していたんだけど、先日ふとGoogleAnalyticsのアクセス数を見ていたら、アクセス数が激減している事に気づいた。どうも「OrganicSearch」、つまりGoogleなどの検索エン...
CSS

WordPressでサイドバーのアーカイブをカスタマイズする

前回の続き。せっかくカテゴリをカスタマイズしたので、アーカイブもそれに合わせてデザイン変更。こんな感じ。問題はWordPressでアーカイブを取得する関数wp_get_archives。こいつはほぼHTMLの形で出力されてしまうため、恐ろし...
CSS

WordPressでサイドバーのカテゴリ表示をカスタマイズする

Webサイトをリニューアルして以来、ずーっと気になっていたのがサイドバーに表示している「カテゴリー」のデザイン。ただ縦に並んでるだけなので、やたらスペースをとるし、何よりカッコ悪い。WordPressの標準についてるタグクラウドも悪くはない...