kiri1701’s diary

勉強したことや調べたことのまとめ用

データ品質の現在地を測る

この記事は、クリスマスに向けデータに関する想いや技術をぶっちゃける Advent Calendar 2022 22日目の記事です。 qiita.com はじめに 朝出勤すると、昨日のデータが連携されていなかったり、ダッシュボードの形が極端に変わっていたりとデータ基盤の障害に…

データマネジメントをスケールさせるには

最近、Data MeshやScaled Architectureと呼ばれる分散型のデータ(分析)基盤について勉強しているので アウトプットも兼ねて、それがどういうもので、なぜ必要なのか説明していこうと思います。 僕の解釈も多く入っているので、間違っている点や気になる点…

Differential Privacy

前回の記事でk-匿名性などを満たすように加工しようみたいな話をしましたが, 現在はDifferential Privacy(DP)という考えが主流なのでそれについて説明していこうと思います. 今回も『データ解析におけるプライバシー保護』[1]を参考にしています. www.ksp…

プライバシーの保護について

最近わけあって,プライバシー保護についての研究をしているので 自分のまとめ用兼文章を書く練習としてプライバシー保護について書いていこうと思います. 『データ解析におけるプライバシー保護』[1]を参考にしています. www.kspub.co.jp 言葉の定義 まず…