「し」抜きで って何なのさ。(恋愛サーキュレーション考察)

迷惑スペクタクルについていろいろ書いた後、「なんだかんだで花澤さんに縁があるよね」と嫁に言われて、ハッと気づいたのでした。
というわけで、懐かしいついでに
2010年01月29日(金) の自分の日記から転載。

もうこれ書いてから4年も経ったんですねぇ。。

—–以下転載—–

巷で噂の恋愛サーキュレーションに

「し」抜きで いや死ぬ気で!

という歌詞があるんですが、これが何をさしているのかというのをちょっと前に考察したので書いておこうと思います。

「し」抜き とは
ドレミファソラシドの「シ」が無いことをさしているんじゃないかなーと推測しています。

以下検証。

まず、恋愛サーキュレーションの主旋律を適当にシーケンサに打ち込んでみました。

Eメジャーです。

続いて、シが無いのを判りやすくするためにCメジャーに移調してみます。

Cメジャーは、ドレミファソラシド(つまり全ての白鍵盤)で構成されますが
見て判るとおり、シがありませんよ。

というお話だったのさ。

ちなみに、ニコニコで
『「なでしこ」から「し」を抜くと「なでこ」になる』説も見かけましたが、
両方考えて歌詞書いたんじゃないかなーという気がしています。

実際のところどうなんでしょうね。

—–以上転載—–

というのが当時の日記でして。その後、神前さんがmixiでこの解釈で正しいと日記を書いていました。
もう、アニメ鑑賞は死ぬまでやってるんだろうなぁ。って思うよなぁ。。

迷惑スペクタクルのCDの音質をいい加減どうにかしてほしい件

ちゃーりーです。
火曜日はお休みだったのですが、
そういえば、前に「となりの関くん」というアニメの主題歌CDを買ったなぁなどと思い出し、聞いてみることにしました。

TVの放送の時点で、わかりやすいハードクリップっぽい音がして、
CDの方はどうなってるのかなーって思ったりしていたのですが、
まーやっぱりひどかった。

というわけで検証ブログでも書いてみましょうぞ。

ハードクリップっぽい音のする部分を確認してみる。

テレビで聞いても気になったのは、「毎日 大迷惑」の「ち」の部分だったので、まずはこの部分を確認してみます。

データ上、音量は控えめで、オーバーゲインによるクリップは無いように見えるのですが、

meiwaku1

ちょっとまて!

謎の曲線が見えます。(赤線部。画像をクリックして拡大表示推奨です。)

meiwaku2

あと、ほかのところは黒いのに、なんか右のほうに白い波形があるぞ。。?

meiwaku3

少しDTMやっていて、マスターの波形見たことある人なら気づくと思うんですが、
普通、こういう波形はできないわけです。

これはもう、明らかにおかしいぞ。ということになります。

じゃあ似た波形を作ってみよう

こういった曲線は、いろいろ考えてみたところ、ハードクリップさせた波形を、さらにコンプレッションすることで作り出すことができそうだと気づきました。

というわけで、作ってみましょう。

まずは、キックを一発用意します。これが元の波形。

meiwaku4

次に、これをハードクリップ(音量超過)させます。直線ができましたね。(赤線部。)

meiwaku5

そして、さらにコンプレッサーをかけます。

meiwaku6

うんうん、なんだかそれっぽい曲線ができましたね。(赤線部。画像をクリックして拡大表示推奨です。)

これで、ある程度説明がつきそうです。

謎の高音による迷惑スペクトログラム

先ほどから話題にしている「ち」の白いほうの波形をさらに拡大してみることにします。(画像をクリックして拡大表示推奨です。)

meiwaku7

なんだか、波形がものすごくギザギザです。
こんなの見たことがない。白い線が上に行ったり下に行ったり凄い勢いでしてるので、引いてみると白い塊に見えたんですね。なるほど。

サンプルごとに波形が大きく上下しています。
CDのサンプリング周波数44.1kHzなので、その半分の22.05kHzの音が鳴っている、ということになります。

この部分を、スペクトログラムという、横軸に時間、縦軸に音の高さを取り、それぞれの時間にそれぞれの音の高さでどれくらいの音が鳴っているのかというのを表すグラフがあります。(画像をクリックして拡大表示推奨。)

meiwaku8

これで表示させると、問題の「ち」のところは、表示可能な上限ぎりぎりのところが白くなっている、つまり、そこの音の音量が大きくなっているということを目で確認できます。(青丸部。)普通、こんなところが真っ白になったりしないわけです。こんな高音は大迷惑ですね。(フラグ回収)

これは、なんというか、単純なハードクリッピングによって作り出すことは出来ませんし、おそらくアナログのエフェクターによる処理でも作ることは出来ないと思います。
サンプリング周波数が44.1kHzのデジタル処理でのみ作りうる波形だと思います。
そこまでは分かるのですが、なんていうか、この22.05kHzをmixingやmasteringの過程でどうやったら作れるのかについては正直良くわかりません。

しかしここで波形を良く見てみると、実は、下に図示した2つの丸の中の形が、何となく相似の関係にあることが分かります。(画像をクリックして拡大表示推奨です。)

meiwaku9

でも、そこまでしか分からない。もしかしたらおかしなことになる前の波形を再生することができるかもしれません。
ありそうな線としては、使ってるアプリケーションのクリッピングの処理にバグがあり、ラップアラウンドしてしまっている。とかでしょうか。この辺の検証をするには、波形ではなくてビット列レベルでデータを検証する必要があるため、結構骨が折れそうです。

ただ、なんにせよ曲を通して1回スペクトログラムを表示していれば、おかしな高音が混ざっていることには容易に気づけたのではないかと思います。
気づかなかったのなら、エンジニアはちゃんと仕事しろって話になりますし、意図的であるなら、いくら何でもちょっとひどいんじゃないかなぁと、素人ながらに思います。

なんでこんなことになってしまうのか

以前にblogで取り上げたラブライブもそうなのですが、素人目に見ても、それってどうなのかなぁと思うような処理が行われたまま出荷されるアニソンが世の中にあふれてしまっていて、なーんでこんなことになってしまっているのだろうと、頭を抱えてしまいます。

アニソンのような初動で大きく売り上げて、その後は売れなくなるといった性質を持っている音源は、真面目にmixやmasteringに取り組んだところで、売上が変わらないのではないかと思います。
もしも、誰かが、音が悪いと気づいたところで、それが知れ渡る前に、多くの人が購入済みになってしまっている。それに、音が多少歪んでいたところで、多くの人は気にしない。
従って、そういった細部にこだわったとしても、売上は伸びない。音楽を生活の糧にしている人にとっては、そんなこだわりにはお金にならないし意味が無い、と言うことになってしまうのかなという気がしています。

実際にそう思っている人が居るかどうかというのは分かりません。

でも、それはなんていうか、なんだろう。もし、こういったことが実際にあったとしたならば、購入する人にとっては、あまりに酷だし、悲しいんじゃないだろうか。と、思います。少なくとも、自分は、そろそろ正直辛い。アニメも音楽も好きだから、悲しい。ぶっちゃけ泣きそうだ。

だからこそ、こういうことに気づいたら、もっと綺麗に作って欲しいよ。歪みが気になっている人も居るんだよ、と、伝えることが最初のステップとして必要なんじゃないかなと思いました。
そういう気持ちで、拙い文章ではありますが、だらだらと書いてみました。

以上。

 

追記

一応、こっちの機材のミスがあった場合のことも考えて、スクリーンショットに使ったwavをリッピングしたのと、PCもCD-ROMもリッピングに用いたソフトも異なる環境で、もう一度確認してはみましたが、同じでした。

うーむ。。

追記 その2 ハイレゾについて

この曲もe-onkyoでハイレゾで配信が行われているため、こちらも購入し確認してみたところ、CDと同様におかしな波形となっていることを確認しました。

適当にイヤホンで確認した感じだと、サンプル単位で、音が一致しており、逆相でぶつけると綺麗に消えます。なので、リマスタリングを行いなおしているわけではなくて、多分、CDの音から量子化ビット数を上昇させるような処理のみを行ったものであると思います。

これについてはかなり面白事案だと思うので、明日にでも検証してみようと思います。

追記 その3 ハイレゾ検証してみました

ハイレゾの音源を改めて確認してみたところ、ちゃんと24ビット分使われていることがわかりました。

ただし、逆相でぶつけると量子化の余り(つまり24bitから16bitへ変換された際の誤差)以外は消えるため、元の音源は同じで、CDで起きている問題はそのまま同じようにハイレゾ音源でも起きているといえます。

先日の追記その2に関しては誤りでした。申し訳ありません。

Studio One 2.6を使ってみた。

あらまし

長らく(もうかれこれ4年くらい)DAWはSonar の8.5を使い続けていました。

ハウスを書くときにはあまり不自由はありませんでした。しかし、SonarのあるバージョンからX2までに関しては、オートメーションのコピー&ペーストにバグがあります。このため、オートメーションを多用するエレクトロハウス、EDMなどを作るのにあたり、本当ならコピペで済むはずのところを何度も同じオートメーションを書いて回るという苦行が発生し、さすがにもう耐えられなくなってきたのでした。(なお海外の掲示板によるとX3では直ったらしいです。)

まぁ、Sonar 8.5が発売されてから長いし、世の中的にはvst3だなんだという話になっているため、バージョンを上げたい。しかし、Sonar X1以降は大きく操作性が変化するためどうしたもんかなぁ というのが最近の悩みでした。
で、どうせ操作性が大きく変わるなら、別のDAWについても検討する余地があるはずだよね、ということで、Cubase Ai Elementのデモ版とStudio One 2のデモ版、両方触ってみたところ、Studio Oneのほうがとっつきやすかったので、ループをちょっと書いてみることにしました。

Studio One 2使ってみた

所要時間はDAWになれるのに2時間、書き始めてからここまでが5時間の計7時間くらい。
で、できたのがこちら。

画面はこんな感じ。

s1

最初はSonarと違うところに驚きっぱなしだったのですが、慣れてくると、合理的だなーって思えてきました。

Studio One は音がいいといわれているけど本当?

Studio Oneが気になっている人が気にしているのってここだと思うんですが

ぶっちゃけ良くわからなかったというのが正直なところです。もともと使っていたのがSonarでSonarは割と大昔(Version 5くらい)から64bitでmixしてくれていたという事情もあるのかもしれないです。
「音がいい」って証言している人は、たいてい移行元がProtoolsなので、Protoolsと比較して、ってことはあるのかもしれないですが、自分自身がProtoolsをちゃんと使ったことはないので・・・
あと、masterにマスタリング用のリミッターとか刺しちゃうと、mixが綺麗かどうかよりもリミッターの品質のほうが支配的になるんじゃないかなと思いました。
ということは、古くからProtoolsを使っていて、プリマスタリングは人に任せて自分はマスタリング前の2mixを吐き出せばいいといった立場の人にとっては、差を実感しやすい、位の感じなのかもしれません。

あと、vstは、バージョン2.4未満は未サポートなので、動きません。つまり、現行製品か、長期的にユーザが居てメンテナンスされているものしか使えない、ということになり妙なvstは使えなくなります。そして、最初から付いているエフェクターの品質はそこそこ良いので、普段使ってたもの使えないからDAWについてきてるのつかうかー となった場合に差が出うるかな という気がしました。

とはいえ、キックのリリースに変な音が混ざってる、とか、シンバルが音量過多で歪んだからコンプでちょっと叩いておこう、とか気づいたのでいいことはいいのかもしれないけど・・・これがStudio Oneの音がよかったおかげなのかといわれると、ちとわからない。。

乗り換えしやすいように学習曲線の立ち上がりを意識して作られていると思う

2時間で大体慣れた、というのは先に書いたとおりなのですが、これは、使い始めた人がすんなり使えるようにという配慮がいろんな場所でなされているからだと思います。
画面とショートカットの対応関係が理解しやすくてすんなり入ってくる感じだったりとか、異なる画面でも似たようなことをしようと思ったら同じショートカットが割り当てられているとか、なんかそういう感じで、快適に使えるようになるまでに必要なコストが小さいという印象を受けました。
だから、多分乗り換えにとても良い。

付属エフェクトは一通りあるけど音源は不足

cubaseやsonarに比べれば音源が不足していて、DAWを買ってくれば付属の音源を使ってすぐに曲を書けるようになります!って感じではない気がしました。なんていうか、まだバージョン4のころのableton liveっぽい感じで、リズム用サンプラー、音階つけれるサンプラー、あとvasみたいな感じで音源はとてもシンプル。ちょっとこれだけで書ききれる感じはしないので、何か音源が必須だと思います。とりあえずKomplete買ってしまえばさして問題にもならないのかもしれません。

他のDAWから乗り換えてくる場合には、もともとの環境で使っていた音源が山ほどあるはずなのでやっぱり問題にはならないのかなと思います。

midi編集は使いやすい!

ピアノロールで、ノートの始点、終点、ベロシティーが1回の操作で全部指定できます。このインタフェースはすばらしい!
この発想はなかったわ。。

お安い

フルバージョンが3万円くらいで買えます!おやすい!すでに手元にあるDAWのバージョンアップとさして価格が変わらない場合は迷ってしまうかもしれないです。

結論:いいじゃないこれ

とはいえ、国内では発売が遅れているけどそろそろ発売sonar x3のほうも試してからどうするか考えようと思います。

ラブライブ「Snow halation」 CDとe-onkyoハイレゾ音源聞き比べ

先日、友人F氏の働いているオーディオ屋に遊びに行って、音源持ち込んでいろいろ聞かせてもらいました。さすがにペアで100万もするニアフィールドモニター(ちなみに、musikelectronicのRL940)はいいなーとか思ったりしました。

聞きたいと思っていた持込み音源の試聴も一通り終わって、一息ついたときに友人F氏がこういうわけです。「ラブライブのハイレゾ音源聞きました?」と。
いや、なんか、以前にtwitterのTLに流れてきたブログ(http://jobless-fish.com/?p=135)ではCDがひどいとかいろいろ言われているのは前に見たし、音源あるなら聞いてみようじゃないかという話になり、聞き比べしたら確かにかなり違う。違うけど、別にこれはクリッピングに依存するものじゃなくて、もっと大きな違いである気がしたわけです。

で、日を改めて、CDとハイレゾ音源を購入し、一体全体何がどう違ったのだろうと考えてみることにしました。自分も趣味とはいえ、音楽をやっているものの端くれとして、この違いが何であるのかを検証し、今後の自分の音作りに役立てられればと。そう思ったわけです。

ちなみに、調査には Cakewalk Sonar 8.5とiZotope OZONE5を用いました。比較用の音源には、シングルのSnow halationとe-onkyoで販売されているハイレゾのSnow halationを用いました。

 

 音量の比較

まずは、簡単に音量の違いからいきましょうという感じで。音量の比較には、わかりやすさ重視のために1番のサビから25小節(「届けて切なさには」から「まもなくSt」まで)を用いました。

比較した結果がこちら。

CD e-onkyo ハイレゾ
ピーク -0.0db -0.1db
VU -5.3db -6.0db
LUFS -6.0 -6.8

まぁなんていうか、CDのほうが大きいです。各項目の雑な説明。

  • ピーク
    デジタルのデータ上でもっとも大きい瞬間の音量。最大値が0.0db。値が大きいほど音量が大きい。
  • VU
    0.3秒の音量の平均。人間の耳は急な音量変化には反応できず感じる音量は0.3秒くらいらしいので、人間の感じる音量に近いらしい。使ったメーターがVUの最大値をキープしてくれないので目で追いかけてこれくらいが最大かな、と思った値を使用。これも値が大きいほど音量が大きい。
  • LUFS
    VUでは音量の平均だけを取っていましたが、もっと人間の感じる音量に近づけるために、いろいろ計算しているメーター。放送するときの基準音量などに用いられている。25小節のループ区間の平均値を使用。これも値が大きいほど音量が大きい。

というわけで、なんとなく、人間が聞いたら0.7dbくらいCDのほうが大きく感じるらしいです。なるほどなるほど。ピークはまぁ、CDの方はクリッピングしているらしいので当然0.0dbって感じでした。

周波数ごとの音量のバランス比較

次は、周波数ごとの音量の違いについて調べてみます。まあ要するに、低音の音量が大きい、とか、高音の音量が大きいとか、そういう話です。

調査方法ですが、iZotope OZONE5についている、マッチングEQ用のスナップショット機能を用いて、1番のサビから25小節のスペアナの平均値を取りました。

結果がこちら。

snowhalation_compare

全体的に音量が違ったりみたいな差はあるのですが、大きく違うのは高音域の部分です。CDのほうがかなり大きく、しかも16000kHz付近にピークがあります。この音は、結構チリチリして聞き疲れします。家に帰ってきてCDを最初に聞いた印象は、「高音キツいなぁ」だったのでこの時点でなるほど感ありました。
ちなみに、この音域って、加齢に伴って聞こえづらくなってくるぎりぎりの帯域なので、ここをどう思うかってのは個人差が結構あると思います。いわゆる、歳を取ると聞こえなくなってくる、モスキート音って言われるあたりの音がこの辺です。若者がたむろするのを防止するためにも使われたりする音なので、聞こえる人にとっては疲れる音、でもあるのかなと思います。

他にも細かい差が結構あって、50HzあたりはCDがちょっと大きく、120Hzあたりと2000Hzあたりはハイレゾが大きいという感じでした。
50Hzと120Hzの音量差はマルチバンドコンプの低域のセッティングの違い(CD版のほうがアタック早め)によるもの、2000Hzのあたりが大きいのはEQのセッティングの違いによるものかなという気がします。まぁ、正直このくらい細かい話になってくると良くわからん。

 

歯擦音が気になる

聞いていて気づいたことで、この辺からだんだん説明が難しくなってくるのですが、スペアナを眺めている最中に歯擦音の周波数帯域がやたら高い位置にあることに気づきました。

歯擦音というのは、雑に説明すると、ローマ字で言えば「s」の音です。サ行の最初に出る、空気がスーと抜けていくときの音のことを言います。一般的に、歯擦音は6000~10000Hzを中心に存在する音です。ミキシングの過程で、急激な音量の上下や聞き疲れを避けるために、この音を小さくする処理を行うことがあります。このような処理専用のディエッサー(desser)と呼ばれるエフェクターも存在するほど一般的な処理です。

ですが、この音が妙に気になるというか、Snow halationの場合は、10000Hzから16000Hzにかけて歯擦音が残っているようで、サ行を発音するときにスペアナのこの部分が大きく出ていることに気づいて不思議に思いました。そんなところに歯擦音、普通できないよなぁ。。と。

意図的な処理なのかもしれませんが、これもまた高音が大きく出ていることと相まって、音がシャリシャリして聞き疲れする一因になりうるよなぁという感じがしました。

snowhalation_s

ちなみに、サビの歌いだしの「とどけてせつなさには」の「せ」の部分です。どの歯擦音もこんな感じでした。歯擦音ってこんなに上まで出るものでしたっけ?

 

まとめ:なんかCDのほうが音量でかくて高音が特にでかい

音が悪いって感じるのは、この辺の違いなのかなーと思って、EQで上のほう削ってみたら、だいぶ聞きやすくなりました。

ハイレゾの方が理論上、より高い音が多く出るので高音をたくさん出すのかなと思っていたのですが、そういうわけでもなかったので、ちょっと意外な感じでした。

マスタリングが違うだけでこんなに違うんだなぁと言うのが良くわかる例だったと思います。
うーん。勉強になった。他のリマスタリング盤でも比較してみたいなぁ。

さよならthinkpad。大好きだったよ。

なんだこのキーボード。。

これが新しいx1 carbonか。。よりによってx1 carbonか。。って思っちゃうわけじゃないですか。
もう、キーボードの配置がぐっちゃぐちゃに見えるわけで、いやまぁ確かにこれはこれで使いやすいのかもしれないけど、一人の人間が一日に、複数の種類のキーボード触るわけだから、なんていうか、ある程度統一感が欲しかったりすると思うのは、まぁ普通ですよねぇと。

キーボードの話だけじゃなくてポインティングデバイスの方も混乱を極めているなぁという感じがしていて。。

新x1 carbonもそうですし、x240やt440あたりもそうですが、トラックポイントのボタンと、タッチパットが一体化したりしていて、トラックポイントの立場がだんだん危うくなってしまっている感じがすごく強くて、つらいなーと思っているのは僕だけじゃないと思います。
でも、これもまぁ、最近は複数箇所タッチ可能な事を前提として、やれピンチインやピンチアウトで拡大縮小だとか、指二本で回転させるだとか、そういったスマホやタブレットの流の操作が当たり前になってきていて、こういった操作をトラックポイントでどのように実現しますか?と言われると中の人も頭痛くなってくるのも容易に推測可能なわけです。特に、Windowsは、タブレットとデスクトップに同じOSを適用していく方針だから、この辺のUI設計・ハードウェア設計をどうしますかって課題は、他のOSに比べて一段と頭が痛そうです。

みんながんばれ。

自分としては、とりあえずタブレットPCとthinkpad bluetoothキーボードで当面はやり過ごそうかなぁと思っています。
デスクトップPCでは、キーボードとマウスは個々人が好みに合わせて選ぶって文化だけど、案外モバイルPCとかでもキーボードとポインティングデバイスは好きなものを選んで使いましょうという文化になる、そういう未来も意外あったりするのかも。とか。

↓これ、欲しいなーって思っていました。今見てみたら安売りになってる!ラッキー!とか思ったんだけど、思いのほか出来が悪かったみたいです。切ない。タブレット向けのいいキーボードとポインティングデバイス、ないものかなぁ。。