文献の詳細
論文の言語 | 日本語 |
---|---|
著者 | 能祖 正樹,黄瀬 浩一, 岩村 雅一 |
論文名 | Local Text Reuse Detection のLSHによる高速化 |
論文誌名 | データ工学と情報マネジメントに関するフォーラム論文集 |
発表番号 | D8-6 |
査読の有無 | 無 |
年月 | 2009年3月 |
要約 | Local text resuse detectionとは,文書の部分的なコピーを発見する技術であり,文書の盗用検出に有効である. ただし,この処理には,データベースの規模を大きくすると,処理時間が大幅にかかってしまうという問題がある. その原因は,大量のデータに対して最近傍探索を行うためである. 最近傍探索にかかる時間を短縮する手法の一つに,近似を導入するものがある. そこで,本稿では近似最近傍探索の一手法であるLocality-Sensitive Hashing(LSH) とSpherical LSH を用いて,local text reuse detectionの処理を高速化する手法を提案する. |
- BibTeX用エントリー
@InCollection{能祖2009, author = {能祖 正樹 and 黄瀬 浩一 and 岩村 雅一}, title = {Local Text Reuse Detection のLSHによる高速化}, booktitle = {データ工学と情報マネジメントに関するフォーラム論文集}, year = 2009, month = mar, presenID = {D8-6} }