デジタルデータの橋渡し

いま重要だなと感じている3つの項目について書き送った散漫なメモ+α。ですます調のほうがあとの自分にとって伝わりやすい気がするので、今回はですます調で。3つの項目は以下。

  1. エスノグラフィックなアプローチ、人類学的アプローチ
  2. 長期保存
  3. 情報倫理


note: 話の前提になっているのは冬学期前半の講義と資料とディスカッション。それぞれ関連メモ等を参照。


1. エスノグラフィックなアプローチ、人類学的アプローチ
未来の利用者にとって必要になる情報とは何か、というのは、橋渡しする対象となる情報を収集する、という最初の段階で考えるべきことです。ですが、デジタルデータをキュレーションする過程でぶつかる問題は、利用者と関係するものが多いです。その問題を明らかにする方法として、エスノグラフィックなアプローチ、人類学的アプローチを重視している、というのが、ひとつ、重要な点だと思います。
講義が始まる前は、プログラミングなど技術的なレッスンなどもあるのかなと想像していましたが、いまのところはそうではなく、それ以前の、問題解決に対する姿勢の部分に対峙しています。
エスノグラフィックなアプローチも人類学的アプローチも、新しいものではありません。以下の論文は、大学図書館での約10年前のプロジェクトの成果ですが、具体的にどう活かされるかがわかりやすかったです。
Nancy Fried Foster, Susan Gibbons, 2007. Studying Students: The Undergraduate Research Project at the University of Rochester, Chicago: American Library Association. http://www.ala.org/acrl/sites/ala.org.acrl/files/content/publications/booksanddigitalresources/digital/Foster-Gibbons_cmpd.pdf
エスノグラフィックなアプローチというのは、ざっくり言えば、ある文化の中に生きているひとがあるものごとをどのように認識し理解しているかを明らかにすることを目指して、インタビューや、コミュニティの中に入っていく参与観察、アンケートの集計など、さまざまな方法を用いて研究する方法、だと思います。未知の地域や未知の文化世界に入り込んでいく、というような「大きな文化」が対象なのではなく、大学図書館なら大学図書館の利用者のふるまいや習慣や思考方法や認識(小さな文化)を理解して、大学図書館が提供すべきサービスの改善を図る、という感じです。

これを踏まえて、講義では小さな文化(micro culture)について考える、ということをしています。例えば、

    • デジタルアートをアーカイブする、というときに、どのような点を残すことが「デジタルアートを残した」ことになるのか?
    • 出来事Aについて記述する未来の歴史学者のためにどのような情報を残す必要があるか?
    • 絵画のデジタル化、というときに、どのような色、どのような精細さでデジタル化すれば、それを見るひとは「本物と同じ」と思うのか?

といったことは、利用者の見方、利用者の認識を知らなければ明らかにできません。
これが明らかにならないことには、例えばいまあるデジタル化の技術のうち、自分が担当することになったデジタル化において、どの機械を選ぶのがもっとも適切なのか?ということを考えることができません。ただし、利用者の認識を知るためには、実験的にサンプルを作ってみる必要がある場合もあります。つまりスモールスタートが必要なこともあります。
考えてみれば、まったく当たり前のことではあります。でも、図書館(サービス提供者)側が、利用するひとへのリサーチから始めて、その後のプロジェクトを考える、という取り組み方は、いま、必ずしもできていない、と思いますし、必要なことだな、と思います。
「利用者」をどう絞るのか問題は、いつでもつきまとうことですが、始めてみて見えることって、あると思うのです。「まずやってみる」という取り組み方は、いろいろな枠組みのなかで許されたり許されなかったりします。ですが、泥臭くて地道な作業で、数字としては出しにくい結果になるとしても、取り組んでみて見えること、取り組んでみなければわからないことって、あります。よその国の類似機関が出した結果だけをもらい受けてその手法を適用するだけではひずみが生まれるし、そのひずみは不幸を生むなぁと思います。だから「枠」を逃れてでも手をつけていく。枠を逃れて取り組みを広げるというのは、それができるかどうかは、ヒトに依るところも大きいですが、それができる人の隣にいられて泥臭い地道な作業をさせてもらえていたときのことを思い出して、ああいう取り組み方を広げられたらいいなぁかっこいいなぁと夢想します。
あと、書き送ったあとに「実空間だとまだやりやすいとしても、オンラインでどうするのか」という問いをもらいましたが、オンラインの利用者も人間なので、認識や理解を追究するという点で、それほど機械機械して考えなくてもいいのではないかという気がしました。「気がしました」レベルの話なので根拠がなくてまったく弱いですけど。。。


2. 長期保存
長期保存もとても重視されていますし、重要なことだなと思います。何を残すか、ということを議論しない組織もありますが、残すべき重要な情報とは何か、重要なパラメータとは何か、という点について考えるのって大事だな、と感じています。
これは、もう少し広げると、例えば大災害が起きたときにどの資料・情報・データから守るか、という、組織で残すべき情報の優先順位にも関係するものです。そしてその優先順位は、組織のなかで考えるべきものです。ほんとは図書館でもコレクション構築の指針として、収集すべき重要資料・情報はコレ、というのを持っているのが望ましい、けれど、実情、ないに等しい、というのがほとんどですよね。
そして保存メディアが永遠ではないことが明らかであるときに重要なのは、ほんとうに単純なことですが、

    • 複数箇所で複製を保持すること
    • オリジナルはオリジナルで保存すること
    • 提供するのは複製したものだけど、複製したものが損なわれたときにオリジナルからまた複製する必要があること

を、常に念頭に置くこと、なのかな、というのがいまのところの私の理解です。講義では、コピーには必ず欠損がある、と口を酸っぱくして言われています。デジタルデータの複製にも必ず誤りが生じる、その誤りコピーは見破れる場合と見破れない場合がある、修正できるものとできないものがある、それだからデータは壊れるものと考えよ、と。怨念が込められている気がするくらい繰り返し言われます。それくらい複製データは信用できなくて、そして、でも、だからこそ、複製しておくこととオリジナルをオリジナルとして保存しておくことが重要、と。サービスのために提供するものと、長期保存しておくものとは、分けるべし、と。そうくちにする先生がまたさみしげに笑ったりするので、それがさらに…毎回の講義でみしみし刻まれている感じです。


3. 情報倫理
情報倫理の面も、重要な問題だと感じています。これはステークホルダーがとても多い難しい問題ですが…。

    • お金の回り方、情報の回り方の全体を知ること。
    • そのサービスで、誰がbenefitを得ているのか考えること。
    • そのサービスのために、誰が何を提供しているのかを考えること。

研究者、図書館、出版社、といったプレイヤーと、個人情報や利用の履歴データ、ピアレビュー、その依頼、データベースの維持管理、といった関係のある要素や仕事をそれぞれリストアップしてみたときに、誰が何を提供して、誰が何を得ているのか、その対価は妥当に支払われているのか、支払われていない場合はそれはフェアと言えるのか、学術のしくみとして、それは望ましいあり方と言えるのか、言えないならば、何を変えるべきなのか、考えないとだなぁと思います。ウェブサービスも、シリアルズクライシスも、APCも、オープンアクセスも、情報が回っていくなかで学術が先細りしたり腐敗したりしていかないために何が必要なのか、どういうしくみが必要なのか。誰かにとって無料のサービスは、誰が何に出資することで提供されているのか。アクセスする側もアクセスを提供する側も図書館もアカデミアも、自分の役割となっている部分だけではなくて、その全体のしくみを知り、それが望ましい姿なのかどうかを、未来も含めて考える必要がある。ということを、情報倫理の講義とディスカッションを通じて、強く感じさせられています。
で、話し合ったり考えたりしたあとに、「考えました」で終わるのではダメで、「望ましい姿」に向かうために自分や自分の組織がすべきことはなにか、いますぐ何ができるか、時間をかけたら何ができるかを考える、必要なら協力しあって何かを変える、誰かを動かす、対決する、というのも必要なんですよね。ここで明確には書けないけれど「手を組んで戦ったらどうなの?」という意味のことを言われて、ほんとにズンときた重さを、忘れちゃいけないなぁと思っています。


★……、で?
こうして考えてみると、私が「いま持ち帰りたい」と思うのは、

    • 自分たちの状況をもっとよく知る
    • 必要なことは何か話し合い、改善のための方策を考える

ということを、自分の組織のなかでも組織を超えてもしたいし、すべきだ、という、とても基本的なことなのだなぁと思います。
決められた枠組みのなかで動くしかない事実と、そう思い込んでいるところ、両方があると思います。それをどう超えられるのかはわかりませんが、枠を取り去って、あるいは取り去らなくても超えることができたらな、と思います。
…と書いて、これって言葉にすると前にも考えたことだなと気づきました。捨象している部分があるので、テーマは違っていたりしますし、私は言葉がざくっとしているので、言葉にすると同じようになってしまうということかもしれませんし、それはそれで問題なわけですが。ただ、「なんでできないのかな、できる人が集まっているはずなのに」と思う部分は変わっていないみたいです。私にはまだ自分の組織がよく見えていないのかな。
あと個人的に、枠に見えるものを超えたいと思う傾向があるみたいだな、とも思います。それは、枠を超えることでよいことが生まれる気がする、と思うことが多いから、でもあるようです。で、それはなんか、いやがられることにつながりやすいのでは、という気もしますが。

ドイツの学生ビザ

2016年9月下旬、ベルリンの場合
2016年7月から、学生ビザの申請を受け付けるベルリン外国人局が、Krause-UferからKeplerstraßeに移動した。Keplerstraßeの外国人局の受付時間や住所などは以下のページに情報がある。

ドイツ語:Standort:Ausländerbehörde Berlin, Standort Keplerstr.
https://service.berlin.de/standort/327437/
英語:Location:Ausländerbehörde Berlin, Standort Keplerstr.
https://service.berlin.de/standort/327437/en/
住所
Keplerstraße 2, 10589 Berlin
交通
U-Bahn 7のMierendorffplatzからは、外国人局方面の出口に出ると道を挟んで目の前に外国人局の門がある。S-BahnのJunfernheideからは、歩いて15分弱くらいかかる。
支払
Giroカード(とPINコード)でのみ支払い可

オンラインで予約(Termin)を取ることができれば、指定された時間に行けばよい。ただし、私が見たときはいつも全て埋まっていて、Terminに空きがなかった。そのため、以下はオンラインでTerminを取れなかった場合の対応になる。現地で係員に聞いたことと、実際に自分が経験した範囲でのことなので、いつでも当てはまるとは限らないと思う。あくまで参考として。

  • 整理券を手に入れる
    • 整理券が朝5時30分から配布されるため、この券をもらえるように並ぶ。Krause-Uferでは午後からも配布するという情報があるが、Keplerstraßeでは、係員に聞いた限りでは、2016年9月時点では朝5時30分のみで、配り終えたら終了のよう。
    • 整理券の配布枚数は日によって違うが1日だいたい50人分とのこと。私が行った9月19日(月)は40人、9月20日(火)は60人以上だったもよう。
    • 9月19日(月)の朝4時20分に到着したときにはすでに120人くらいいたように思う。そのため整理券は入手できなかった。
    • 9月20日(火)は19日の夜11時の時点で8人程度、その後どのくらいの速度で人が増えたかは不明。
  • 整理券に書いてあること
    • 朝5時30分、列に並んでいる順に、係員にパスポートを見せて番号の書かれた紙をもらう。紙には、以下のことが書かれている。
      • 番号
      • 建物の階(B2←日本でいう3階)
      • Nur zur Annahme, keine Garantie auf Bedienung(受け付けただけでサービスをするとは限らない、の意味)
      • 年月日
    • 紙にあるように、番号をもらえても建物内でビザの申請対応をしてくれない場合があるのかどうかは、不明。
  • 整理券をもらった後の流れとかかった時間
    • 紙をもらうとすぐ、建物内へ誘導され、2階(日本でいう3階)に行く。部屋はあたたかく椅子が並んでいる。
    • 6時30分ごろ:番号を呼ばれた人から事務室へ行くよう誘導される。事務室には一人ずつ入り、書類を提出する。確認は一瞬で終わる。持参したものは以下のとおり。
    • 6時30分すぎ:書類を確認した人に、待合室のある3階(日本でいう4階)に移動するよう言われる。待合室の前方には、番号と受付場所を表示する番号掲示板がある。番号が更新されると音が鳴るため、更新音で自分の番号が表示されたか確認する。
    • 7時30分ごろ:40番くらいの人が待合室に入ってきた。書類の確認は一人につき1分半程度ということか。
    • 7時40分ごろ:番号掲示板に番号が表示されたので指定の部屋のある2階へ行く。部屋に入ると椅子にかけるように言われる。そこでは、書類が返却され、学生ビザで問題ないか確認される。パスポートにビザが貼られている!これで完了なので手数料60ユーロを入金するように、と言われる。
    • 7時40分すぎ:支払い。支払い方法は人によると思うが、私はまだ銀行口座を開設できておらず友達が貸してくれたGirocardが手元にあることを伝えた。すると処理を変更して(なにやら紙を出し直してくれた)、支払い金額を設定されたらしいプラスチックのカードを渡され、EC支払いの部屋へ行くようにと言われた。渡されたプラスチックのカードをEC支払いの部屋の人に渡すと、60ユーロだと言われる。Girocardを見せると、クレジットカード払いをするときに使うような機械にGirocardを差し込むようにと言われる。友達に教えてもらったPINコード(暗証番号)を入力したら、レシートをもらって完了。

銀行口座がなかった私は、友達に助けてもらって支払うことができた。友達に助けてもらっていなかった場合、口座を開いたあとに支払えば間に合うのか、それとも現金で支払えるKrause-Uferに行って支払えということなのかは、聞かなかったのでわからない。

ジャック・デリダ『アーカイヴの病』

http://id.ndl.go.jp/bib/000002549112
ジャック・デリダ『アーカイヴの病 : フロイトの印象』福本修 訳、法政大学出版局、2010年11月 (叢書・ウニベルシタス ; 947)

★反省メモ

  • 会誌の先輩から参考文献として示されて読んだ。
  • 日本語にしてくれているのに理解できなかったし、もう一度読んでも理解できないと思う本。意味が頭に入ってこなかった。
  • 著者名とタイトルで検索すれば職場の先輩がいろいろ考察されたブログ記事がさくっと見つかるけれど、私はそこに書かれていることも、なぜそのように読めるのかも、さっぱり理解できなかった。全然だめだ、わからない。こういうのを読む頭が私にはないのだろうと思う。
  • 何を言っているのか、これは何の話なのか、というのが理解できず、何度も挫折しそうになった。読み取ることはおそらくできていない。とにかく理解できなさに耐えてひたすらページをめくったという感じ。
  • 字面を追って、これはなんのことだろう、と思ったことを追いかけながら読んで、これのことだったか、と思ったあとで、いやなんだか違うようだ、と気づいて戻り、しかし最後まで答えらしきものは見えず、もやもやしたまま終わった、気がする。
  • デリダの「アーカイヴ」と「アーカイヴの病」と「欲望」と「暴力」が指しているものは何か?を考えながら読んだけれど、ハテナが増えるばかりで、けっきょくよくわからなかった。
  • さらにこの本のわからなさはフロイトのわからなさ(私がフロイトを全然理解できないこと)も関係している気がする。フロイトを出さないでほしい。フロイトが出てくる部分はどうにもこじつけに思えてハテナが増えるばかり。でも副題にあるくらいだから諦めるしかないなと思ってページをめくった。つらかった。
  • そもそもメモを取りつつ読み終えたのが7月終わりごろで、そのあと放置しすぎてもはや読んだ中身の記憶がない。さっさと感想をメモしておくべきだった。とはいえこのままにするのも、ということで以下はメモだけ取り出しておいた、という記録。


★メモ

  • pp.133-134: 未来はー記録媒体や現実態の有無にかかわらずーアーカイヴ化された出来事から、例えば神の命令からあるいはメシア的契約から考えられるのか、あるいはまた逆に、或る経験、或る実在一般は、この実在と時間化の構造がこのアーカイヴ化を可能にするというただその限りで、そのような出来事を受け取り、記録し、アーカイヴ化することができるのか、ということである。言い換えれば、原初のアーカイヴ化可能性を考えるためには、最初の一つのアーカイヴが必要なのか、あるいはその逆なのか、ということである。
    • →未来は、アーカイヴされた「コト」から考えられるのか、あるいは逆に、実在するものごとがアーカイヴを可能にするのか、という、にわとりたまごの問い?
  • p.141: アーカイヴの欲望(……)は、真正で特異な起源への回帰、回帰の欲望つまりは自分自身を更に説明しようと気にかける回帰の、苦痛に満ちた欲望である。
    • →起源(オリジン)が自分自身を説明するものとなる。説明するものを保存したい、という欲望。その欲望は苦痛に満ちている、と。苦痛ということは、保存したくない気持ちもある、ということでよいのか?
  • pp.149-150: アーカイヴについてのフロイトの言説は(……)概念(……)は、二つの矛盾する形を取る。これが、アーカイヴの病とわれわれが言う理由であり(……)フロイトのあらゆる著作の中に、この矛盾の跡を見出すことができるはずである。このような矛盾は、否定的なものではなく、アーカイヴの概念および概念一般の形成自体をーーそれらが矛盾を抱えているまさにそのところでーー際立たせ、条件づけているのである。
    • →「アーカイヴの病」っていうのは、矛盾のこと?
  • (pp.156-157)(フロイトによれば)アーカイヴは、死の、攻撃性の、破壊の欲動によって(……)可能とされる。しかし限界としての有限性の向こうには、(……)根本的な破壊のあの運動がある。それがなければ、いかなるアーカイヴの欲望も病も生じないであろう。
    • →アーカイヴすることの限界、アーカイヴされたものの破壊、が、あるから、アーカイヴの欲望やアーカイヴの病が生じる、ということ?めちゃくちゃ単純に言ったら、なくなってしまうものだからとっておきたい、ということ?それでいいなら分かる気がするけれども。
  • pp.166-168: 人は、彼が知る欲望、知らせる欲望そして彼がいつまでも隠していた当のものをアーカイヴ化する欲望に燃え立ちながら、秘密への無条件の権利について何を守りえたのだろうかを自問することだろう。自らを隠す(隠れる)ものについて、あるいは、隠したり嘘をついたり偽証したりする意図の更に彼方に、彼が隠したものについて。人はつねに、彼がこのアーカイヴの病において、何を燃やしえたのだろうかを自問することだろう。人はつねに、誰がこのアーカイヴの病を共苦のうちで分かちあいつつ、彼の秘密の情念、彼の書簡、彼の「人生」から、何が燃え立ちえたのかを自問することだろう。彼なしで、残余なしで、知ることなしで、燃え立つこと。
    • →知る欲望、知らせる欲望、アーカイヴ化する欲望、は、ここでは同義なのか?隠したいもの、知らせたくないもの、秘密のこと、がありながら、アーカイヴ化したいという欲望がある、ということ?
  • pp.174-175 訳者あとがき: テクストの”理想郷”は、あくまで原典を集めてアーカイヴへの汚染と干渉を排除することで達成されないのだろうか。しかしそこには、汚染と干渉を不可避にして理想郷の達成を不可能とする、より内在的で本質的な障害がある。(…アーカイヴの)創設には根源的な暴力性が、そして正統な起源への欲望が伴っている。
    • →全部集められればよいけど(=欲望)そうもいかない(=暴力)ということでよいの?そんな単純な話だったの?それなら会誌の先輩が教えてくれた「ELIS 3rd ed.の関連論文」のほうがずっと分かりやすかったし、あれで十分だったのではないかという気がしてきた。
  • p.176 訳者あとがき: 源泉はどこかに遡られるだろうという思考は、今や「アーカイヴの病」として解釈される。
    • →???またわからなくなった。。。

「データセットの引用と出版物へのリンク」より

DCC. How to Cite Datasets and Link to Publications. 2012-06-20.
http://www.dcc.ac.uk/resources/how-guides/cite-datasets

★メモ

  • バージョン管理
    • バージョンを管理するには2つの方法がある。
      • スナップショット:読者または著者はデータの取得後に必要なデータを得るために何も操作しなくてよい。
      • タイムスライス:取得したデータが変更されている可能性が元のデータと異なる可能性があるため、読者または著者は何らかの操作をする必要がある。継続的に更新されるデータには適さない。
    • 「これは、データセットを引用可能なものとして利用者に提示する方法のみに関する問題であって、ひとつの識別子が必ず同一データを返すことを保証できる限り、リポジトリにおけるデータの格納方法への影響はなにもない。」

W3C の SKOS 標準を使用してタクソノミー管理を改善する

W3C の SKOS 標準を使用してタクソノミー管理を改善する:統制語彙用の移植可能な SKOS フォーマットを使ってセマンティック Web に徐々に慣れる
Bob DuCharme, Solutions Architect, TopQuadrant 2011年 6月 10日
原文:不明。
和文http://www.ibm.com/developerworks/jp/xml/library/x-skostaxonomy/

★感想メモ
・SKOSの語彙の使い方の部分はSKOS入門を読むほうがよいと思った。

★メモ

  • 同じ組織内の異なるグループが独自の語彙を使って管理している場合、それを一つの語彙に統合するのは有害無益である。
    • →データの規模が大きくなるにつれて語彙の保守が複雑になり、データの改訂が必要になる。
    • →無理に語彙を改訂、統合した一体型の語彙は、どのグループの要求にも完全には対応できなくなる。
  • SKOS を使用することで、異なる語彙による概念の間に関係を定義することができ、さまざまな部門の語彙を統合的に利用できるようになる。
  • SKOS オントロジーを使用していなくても、RDFによってデータをリンクすることは可能。
  • The New York Times が無料で公開したSKOS ベースの件名標目索引は、各出版社が自社の独自コンテンツをThe New York Times の記事にリンクさせるために使うことができ、The New York Timesの記事には、より多くのトラフィックが集まるようになった。