※当サイトの記事には、広告・プロモーションが含まれます。

Excel関数で基本統計、一般的には記述統計(Descriptive Statistics)に関する統計量が算出できる

forest.watch.impress.co.jp

⇧ amazing...

基本統計、一般的には記述統計(Descriptive Statistics)と呼ばれるとは?

Wikipediaさんによりますと、

要約統計(ようやくとうけい、summary statistic)あるいは、記述統計descriptive statistic)とは、標本分布の特徴を定量的に記述し要約する統計学上の値であり、統計量の一種である。基本統計basic statistic)または代表値(representative value)とも呼ばれることもある。

要約統計量 - Wikipedia

⇧ 統計量の一種であると、説明してるけど、これは間違いっぽくて、後述する英語版のWikipediaの説明が正しいと思う、多分。

統計量とはと言うと、

統計量(とうけいりょう)とは、統計学において、一組の標本データに、目的に応じた統計学的なアルゴリズム関数)を適用し得た、データの特徴を要約した数値を指す。なお十分性をもつ統計量を十分統計量と呼ぶ。日本産業規格では「確率変数だけで規定された関数」と定義している。

統計量 - Wikipedia

⇧ とのこと。データに関数を適用した後の値ってことらしい。

統計学は、

blog.jma-net.jp

⇧ 上図のような分類になるようで、「基本統計」は「記述統計学」に関わるものということになるかと。

Wikipediaの「記述統計学」のまとめっぽいものを確認すると、

⇧ 上記が「記述統計学」における「統計量」の一覧になるってことになるんですかね?

このあたりがブラックボックスというか、

www.stat.go.jp

総務省の統計局のサイトを確認してみても、「記述統計学」における「統計量」についての定義が見当たりませんと...

「記述統計」についての英語版のWikipediaの説明を確認してみたのですが、

descriptive statistic (in the count noun sense) is a summary statistic that quantitatively describes or summarizes features from a collection of information, while descriptive statistics (in the mass noun sense) is the process of using and analysing those statistics. 

https://en.wikipedia.org/wiki/Descriptive_statistics 

⇧ 上記をGoogle翻訳したところ、

『記述統計(カウント名詞の意味)は、情報のコレクションからの特徴を定量的に説明または要約する要約統計であり、記述統計(質量名詞の意味)は、これらの統計を使用および分析するプロセスです。』

とあり、日本語版のWikipediaの説明を再掲して確認してみると、

要約統計(ようやくとうけい、summary statistic)あるいは、記述統計descriptive statistic)とは、標本分布の特徴を定量的に記述し要約する統計学上の値であり、統計量の一種である。

驚くほど、意味合いが変わってくる...

というか「要約統計量」の日本語版のWikipediaの「基本統計」の説明は間違っている気がするかな...

「基本統計」または「記述統計(Descriptive Statistics)」については、海外版のWikipediaの情報が正しいということだと思う。

用語の定義をちゃんとして欲しいよね...

総務省の統計局に頑張ってもらいたいところですかね...

Excel関数で基本統計、一般的には記述統計(Descriptive Statistics)に関する統計量が算出できる

総務省が公開してるICT(情報通信技術)の学習教材があるのですが、

www.soumu.go.jp

総務省は、「基本統計量」という言葉を使ってるようですが、「基本統計」または「記述統計(Descriptive Statistics)」の「統計量」のことを言っているのだと思われます。

上記の資料にExcel関数で求められる「基本統計量」がまとめられています。

そして、会社の先輩の方に教えていただいたのですが、Libre Office Calcでも同じく「基本統計量」を算出できるExcel関数が利用できることを教えていただきました。

実際、Libre Office CalcでExcel関数が利用できました。

 

Libre Office Calcの機能でも「基本統計量」が算出できる

これも会社の先輩に教えていただいたのですが、Libre Office Calcの機能でも「基本統計量」の算出ができるようです。

www.e-stat.go.jp

⇧ 上記のデータで試してみます。

Libre Office Calcでファイルを開いて、「基本統計量」を算出したいデータを選択した状態で、「データ(D)」>「統計(J)」>「基本統計量(D)...」を選択。

ダイアログが表示されるので、「結果貼り付け先(B):」に入力を求められるので、

適当なセルを選択すると、結果が出力されます。

⇧「モード」は「最頻値」のことらしいので、年収205.9万円が多いみたいですね。「平均」が約308万円だそうな。

ちなみに、薄給のイメージのあるアニメーターについて、

⇧「一般社団法人 日本アニメーター・演出協会」の調査によると、「原画」の平均年収が334万円で、平均だけ見ると一般的なアニメーターの給与って普通にもらってるように見えるんよね。

アニメーターに該当する「総作画監督」、「作画監督」、「原画」、「動画」、を合わせて平均すると、

 (788 + 538 + 334 + 125) \div 4 = 446.25

およそ年収446万円にはなるけども。

まぁ、確かに「動画」の平均年収125万円だと月々10万円で生活しろってことになるから、苦しい生活になるってことだとは思うけど、というか、ここから国民健康保険料、国民年金保険料なども払うことになると思うので、普通に東京都内だと生活できないと思う。

ただ、

⇧ 現場の声はちょっと異なるみたい。アニメーター5000人ほどらしいけど、2015年度の調査のデータは751人ほどで、2019年調査のデータが375人とのことだから、統計する意味がない気がするよね。

母集団が5000人しかないなら、すべてのデータを集めて分析してみたら良い気はするんですけど、「一般社団法人 日本アニメーター・演出協会」もやる気がないんかな?

まぁ、統計あるあるだと思うけども、

計算機科学において、Garbage In, Garbage Outガービッジ・イン、ガービッジ・アウト/ガベージ・イン、ガベージ・アウト)、略してGIGOとは、欠陥のある、または無意味な(garbage)入力データは無意味な出力を生み出すという概念である。直訳は「ゴミ入力するとゴミが出力される」。すなわち、「『無意味なデータ』をコンピュータに入力すると『無意味な結果』が返される」という意味である。Rubbish in, rubbish out (RIRO)とも表現される

https://ja.wikipedia.org/wiki/Garbage_in,_garbage_out

⇧ 使用したデータが悪ければ、統計する意味ないからね...

そもそも、アニメーターの実態調査って言ってるのに、

以外を含めるのがよく分からん...それに、レイアウト原画、第二原画は「原画」の仕事に含まれると思うし、分類が謎過ぎる...

一般的なアニメーターと言うと、「原画」「動画」のことを指すと思うんだけどな。「総作画監督」とか「作画監督」は普通の会社で言ったら重役クラスな気がするし。

毎度モヤモヤ感が半端ない...

今回はこのへんで。