無料で500万ページの新聞記事を大英図書館がネット上で公開すると発表
大英図書館が所蔵する新聞を電子化するプロジェクトのBritish Newspaper Archive(BNA)が2021年8月9日に、電子化済みのアーカイブの一部を無料公開することを発表しました。
今回無料公開の対象になるのは1880年までに刊行された100万ページで、今後4年間で毎年100万ページずつ、合計で500万ページが無料で閲覧可能になる予定です。
(以下略、続きはソースでご確認下さい)
Gigazine 2021年08月12日 10時42分
https://gigazine.net/news/20210812-british-library-million-newspaper-free/
引用元: ・【ネット】大英図書館が所蔵する500万ページの新聞記事をネット上で無料公開すると発表 [すらいむ★]
2: 名無しのひみつ 2021/08/17(火) 21:45:41.96 ID:oYgg6U4e
1880年までに刊行された100万ページで
_ノ乙(、ン、)ノ ディケンズの記事は読めないみたいね
3: 名無しのひみつ 2021/08/17(火) 21:47:01.40 ID:F6LG0npo
テキスト化されてるなら便利そう
4: 名無しのひみつ 2021/08/17(火) 21:56:41.71 ID:WvpaqEh5
>>3
英語も時代によって色々違っているから当時のテキスト入れないと検索できないよ。
英語も時代によって色々違っているから当時のテキスト入れないと検索できないよ。
7: 名無しのひみつ 2021/08/17(火) 22:09:03.38 ID:bHjNbP9H
>>3
アルファベットだからOCRによる認識は日本語よりはるかに簡単だと思うけど
新聞を1枚1枚スキャンするのはそういう装置があるんかね
アルファベットだからOCRによる認識は日本語よりはるかに簡単だと思うけど
新聞を1枚1枚スキャンするのはそういう装置があるんかね
8: 名無しのひみつ 2021/08/17(火) 22:11:56.41 ID:GiThdiep
日本でも明治・大正の新聞とか読めるようになったら面白いんだけどな
10: 名無しのひみつ 2021/08/17(火) 22:24:33.20 ID:WVZ4MumJ
>>8
誤報・虚報も発売当時のやつが見られたらな
伊藤律会見記だの、もく星号墜落で「全員救助」のやつとか
誤報・虚報も発売当時のやつが見られたらな
伊藤律会見記だの、もく星号墜落で「全員救助」のやつとか
12: 名無しのひみつ 2021/08/17(火) 22:26:38.51 ID:vsvGr0YS
>>8
国会図書館がやるだろ
当然
ある程度やってるよな
デジタル化されて
https://rnavi.ndl.go.jp/research_guide/entry/post-762.php#3
全国の図書館でも見れるだろ
国会図書館がやるだろ
当然
ある程度やってるよな
デジタル化されて
https://rnavi.ndl.go.jp/research_guide/entry/post-762.php#3
全国の図書館でも見れるだろ
9: 名無しのひみつ 2021/08/17(火) 22:23:38.59 ID:vsvGr0YS
NHKの番組なんて当然だよな
国民の金で作ってんだから著作権は持っててあたりまえだが
全世界に無料公開するのもあたりまえだ
国民の金で作ってんだから著作権は持っててあたりまえだが
全世界に無料公開するのもあたりまえだ
11: 名無しのひみつ 2021/08/17(火) 22:25:01.20 ID:bJuIq/iG
新聞記事に使われた言葉、用語、文法、言い回しなどの変遷が研究できそう。
ウェブスター辞書的な英語言語の研究とか。ある言葉がいつから使われだしたのか
とか、ある綴りの変化が定着していく様子とか、外来語の英語化の浸透の様子など。
ウェブスター辞書的な英語言語の研究とか。ある言葉がいつから使われだしたのか
とか、ある綴りの変化が定着していく様子とか、外来語の英語化の浸透の様子など。
13: 名無しのひみつ 2021/08/17(火) 22:28:53.07 ID:vsvGr0YS
>>11
英語は日本語の明治以降の変化に比べれば同時期は大きくは変化してないだろ
ワシントン時代の英語でも理解できる
日本は江戸の文献なんてのは直接じゃ何書いてあるのかわからない
英語は日本語の明治以降の変化に比べれば同時期は大きくは変化してないだろ
ワシントン時代の英語でも理解できる
日本は江戸の文献なんてのは直接じゃ何書いてあるのかわからない
14: 名無しのひみつ 2021/08/17(火) 22:28:58.41 ID:K8mlFHqs
19世紀とかでもOCRでTXT化から検索出来るのは強いよな。
日本もこの部分、AIで頑張らないとどんどん遅れる。
Google Patents検索、しばしば使ってる。
一方で日本ってこの先は難しい気がする。
日本もこの部分、AIで頑張らないとどんどん遅れる。
Google Patents検索、しばしば使ってる。
一方で日本ってこの先は難しい気がする。
15: 名無しのひみつ 2021/08/17(火) 22:30:35.61 ID:vsvGr0YS
>>14
パテントももともと記録してあって保存するって文化があるからこそ
日本は政府議事録さえひと月で廃棄
これじゃ文化は残らない
21: 名無しのひみつ 2021/08/17(火) 22:39:26.26 ID:gASB7aGS
>>15
そもそも議事録とってないぞ
>政府与党のコロナ会議「議事録作成、考えてない」
23: 名無しのひみつ 2021/08/17(火) 22:40:50.79 ID:nGgAFVfz
>>15
あるけど?
福一関連はないって野田が回答済み
あるけど?
福一関連はないって野田が回答済み
20: 名無しのひみつ 2021/08/17(火) 22:37:20.55 ID:nGgAFVfz
>>14
すでにあるじゃん
ググルブック使ってみ
すでにあるじゃん
ググルブック使ってみ
16: 名無しのひみつ 2021/08/17(火) 22:33:43.56 ID:ww7r57Rb
BLはこの分野の先駆者。著作権が解決された範囲からの取組表なのかな。
以前、調べごとでニューヨークタイムズの昔の記事の複写をとった際はけっこうな経費がかかった。ニューヨーク公共図書館でもコピーがとれたらしいけど。まあ整備経費を考えると本来、只はありえないけどね。図書館だからできること
以前、調べごとでニューヨークタイムズの昔の記事の複写をとった際はけっこうな経費がかかった。ニューヨーク公共図書館でもコピーがとれたらしいけど。まあ整備経費を考えると本来、只はありえないけどね。図書館だからできること
24: 名無しのひみつ 2021/08/17(火) 22:43:22.01 ID:vsvGr0YS
>>16
ニューヨークタイムズならサブスクしてればいくらでも昔の見れるしコピーなんて当然できる
サブスクしてなくとも3つくらいまでできるよ
そんなに高くないよ
日本はダメ
遅れてるどころか
17: 名無しのひみつ 2021/08/17(火) 22:35:31.09 ID:S6ZEJwm9
これじゃ毎日金払って新聞取ってた人が馬鹿みたいじゃん
18: 名無しのひみつ 2021/08/17(火) 22:36:11.81 ID:nGgAFVfz
日本は新聞社様が反対しそう
19: 名無しのひみつ 2021/08/17(火) 22:36:25.19 ID:gM5okPJ/
日本語訳も付けてくれんかな
英語の勉強に使えるかな
英語の勉強に使えるかな
22: 名無しのひみつ 2021/08/17(火) 22:40:34.19 ID:73vckuFA
国会図書館は金なさそうだから無理そう
25: 名無しのひみつ 2021/08/17(火) 22:45:14.82 ID:vsvGr0YS
>>22
それなりにやってるぞ
10年前とは大違い
世界に25年遅れてる
やっと気づいたけど
それなりにやってるぞ
10年前とは大違い
世界に25年遅れてる
やっと気づいたけど