Effective Computer Science - 頂は礎の上に -

新しい技術の多くは基礎的な技術の上に成り立っています。激動の技術変化に耐えうる体系知識の習得を目的に「基礎と実践の架け橋」となるサイトを目指します。

2018-09-01から1ヶ月間の記事一覧

【自然言語処理】スタンフォード大学の公開講義

Stanford University CS224d: Deep Learning for Natural Language Processing

【PDFコピペ解決】#濁点が1文字として認識 #文字間に空白

解決方法 ツールを利用する。 濁点誤認識を解決 NFD→NFC変換ツール 【利用手順】 「変換したいテキスト」の枠にPDFからコピーしたテキストを貼り付け 「変換」ボタンをクリック 解説サイト d.hatena.ne.jp 文字間の空白削除 html-css-javascript.com

【Chrome】 タブ移動のショートカットを設定する

アップデート後(2019年9月)上記ショートカットが効かなくなった 以前から上記のショートカットを設定していましたが、アップデートを適用すると再度設定しなければならないようです。 デフォルトのショートカット 「Window」 -> 「Select Next Tab」を見ると…

英語と日本語のWordNet(ワードネット)検索画面

日本語WordNet検索サイト 日本語 Wordnet 英語WordNet検索サイト WordNet Search - 3.1

【Python nltk】英WordNetの使い方

用語 用語 意味 例 Synset 同義語集合 lemmas 見出し語。synsetがもつ特定の意味を表す語の集合 synonyms 類義語 hypernym 上位語 「犬」の上位語は「動物」 hyponym 下位語 「動物」の下位語は「犬」 meronyms 全体-部分の関係 「木」のメロニムは「枝」 ho…

【Mac】拡張機能を使わずリンクテキストをコピーする方法

テキスト付近で「トリプルクリック」 グーグルで検索した直後の、ページタイトルをコピーしたい時なんかに重宝する小技です。 コピーしたいテキストの先頭か最後尾の近くで三回素早くクリックしてみてください。対象文が選択状態になります。 その後コピーし…

【練習問題】サクッと交差検定を理解

交差検定(Cross-Validation, クロスバリデーション、交差確認、交差検証)後の分類表に対して、各評価指標を算出する練習問題です。 問題 クラスCの2値分類問題を考える 以下の分類表から 分類正解率(classification accuracy, 正解率) 精度(precision) 再…

【ディープラーニング】ハイパーパラメーター とは

ハイパーパラメーター(Hyperparameter) 「学習率」や「バッチサイズ」のような「人の手によって設定される」パラメーター ニューラルネットワークのパラメーター「重み」「バイアス」などの「訓練データと学習アルゴリズムによって自動で獲得される」パラメ…

【iBooks 保存先】iCloud併用で、本のディレクトリが見つからない

Mac

Books.plistしかない 以下のサイトによると ~/Library/Containers/com.apple.BKAgentService/Data/Documents/iBooks にあるそうなのですが、「Books.plist」しかありませんでした。 iBooksの保存先 - べるべる研究日誌 iBooksのファイルは何処? – Good Harv…

【ディープラーニング】学習とは

ディープラーニングにおける学習 訓練データから最適な重みパラメータの値を自動で獲得すること 具体的には、ニューラルネットワークが学習を行えるようにするために、損失関数という「指標」を導入する。この損失関数を基準として、その値が最も…

PMI(Pointwise Mutual Information, 自己相互情報量) とは

何がしたくて用いる数字なのか? 意味のある共起 = 価値ある共起 としたい つまり、「"私" "は"」のようなありきたりな共起は省いて、「"ビール" "ワイン"」など、単語自体が頻出というわけではない場合の共起ペアの数値を高くしたい。 自己相互情報量とは, …

階層的ソフトマックス とは

階層的ソフトマックス ロジスティック回帰を階層的なグループ(ハフマン木のノード)に対して使うことでソフトマックスを近似する手法

低ランク近似 とは

低ランク近似 巨大な行列を細い行列の積で近似すること 画像の例では、Vを次元3で近似しています。

Bag-of-Words(BOW) とは

Bag-of-Words(BOW) とは Bag-of-Words とは、「文章」をその中に含まれている単語の 1-of-K ベクトルを足し合わせたもので表現する方法 画像の例では、「あの」に対しては、文のベクトルの0番目の値を1にするというルールが適応されている 例 「私は君が…

1-of-K表現 とは

1-of-K表現 (One-hot表現ともいう) K種類の離散値を取る確率変数の表現手法 成分のひとつだけが1、残りがすべて0となるK 次元ベクトルで表現する

海外の洋書要約サービス(英語)

No1 www.blinkist.com No2 www.getabstract.com 参考 https://www.quora.com/What-are-the-best-book-summary-websites-Are-any-of-the-paid-sites-worth-the-money-Do-you-have-any-personal-summaries-to-share https://www.quora.com/What-are-the-best-b…

【Python csv】UnicodeDecodeError 解決法

csvを読み込もうとしてエラー発生 with open(filepath, 'r') as f: reader = csv.reader(f) for row in reader: print(row) を実行すると以下の「UnicodeDecodeError」 UnicodeDecodeError: 'utf-8' codec can't decode byte 0x91 in position 15: invalid s…

【Google スプレッドシート】ショートカットが使えない場合の対処法

Google スプレッドシート (Google Sheets) でショートカットが効かない場合の対処法をご紹介します。 原因:ショートカットキーが競合している 公式サイトに記載されているショートカットを試してみても、効かない場合があります。 原因としては、別のシステ…

【自然言語処理】lexical とは

語彙体系 語彙は語が集合したものであるが、 その集合の中では個々の語がばらばら に存在しているのではない。ある語と 別の語とが一定の関係で張り合って集 合を構成している。この張り合い関係 のことを語彙体系という。 さまざまな語彙

【自然言語処理】Paraphrase とは

Paraphrase(換言,パラフレーズ) 同じ意味内容を表す,同一言語の異なる言語表現(※翻訳は言語間の言い換えなので含まれない) 電子化テキストの流通量が増す中,そこから様々な情報・知識を獲得するというニーズが高まっており,言い換えの関係にある表現を…

【Chrome】スマホとPCをサクッと同期させる

History(最近使ったタブ)から見れる PCからスマホを見る スマホからPCを見る ※できない場合は設定がされてない こちらで設定

【VDI】簡単デスクトップ仮想化

VDI(Virtual Desktop Infrastructure) it.impressbm.co.jp アプリケーション VMware Horizonでデスクトップ仮想化を実現しよう! | Tintri

【Word】見出し(スタイル)を増やして、ショートカットを割り当てる

「Apply a style(適用する書式の選択)」に表示される数を増やして解決 「Styles Pane(スタイルと書式)」を開く 「List(表示)」の「Recommended(おすすめ)」を「All styles(書式の一覧)」に変更する ショートカットキーを割り当てる 新たなスタイルにはショー…

【WEBライター向け】効率が上がるツール集

「表」をMarkdown / HTMLで出力したい 【Markdown】Googleスプレッドシートから出力するアドオン リンク先からインストールして、スプレッドシートの「アドオン」タブから選択するだけで使える「MarkdownTableMaker」 chrome.google.com 詳しい使い方 【導入…

【OneNote】ブラウザのOneNoteをエクスポートする方法

ローカルのOneNoteアプリでないとできない オンラインからは 「ファイル」タブを開く Infoの「Edit in Microsoft OneNote」でローカルのOneNoteアプリを開く

【Mac Finder】ネットワークに接続

Mac

⌘ + K もしくは、 メニューからGo(移動)=>Connect to server(サーバーへ接続) アドレスを入力しConnect(接続)ボタンを押す

【Mac】Finderで常にフォルダを上に並べる(英語)

Mac

1. ⌘+Jでウィンドウを開く (上部のFinderメニュー「View(表示)」=>「Show View Options(表示 オプションを表示)」) 2. 表示オプションウィンドウで 「Arrange by(並び順序)」 ->「Kind(種類)」 「Sort by(表示順序)」 → 「Name(名前)」(こちらは自由に) 一…

【自然言語処理】使われている技術とタスク

形態素解析 形態素解析は、多くの自然言語処理の必須の構成要素であるとともに、自然言語処理以外の様々 な応用があります。したがって、様々な分野のテキストに対する高い解析精度が求められていま す。しかしながら、学習データ以外の分野のテキストに対す…

自然言語処理がなぜ難しいのか「具体例」で素人に説明したい

人間の会話であたりまえに行われている“高等技術” 人が日常の会話において、とくに意識することなく理解していたり、習得していたりすることの中で、AIには対応が難しい項目を挙げています。 「常識」などの明確な定義ができないものは、AIが獲得することが…

【Googleドキュメント】音声文字起こしも画像文字認識もできる最強のツール

Googleドキュメント クラウド上で、どんな端末からでもアクセスできるノート。 単にノートを取るだけでなく、Googleの最新技術が詰め込まれた最強のツールとなっています。 音声認識 文字起こしに使えます たとえば、スマホで保存した音声データを流しっぱな…