文字を生成する魔法のような技術の勃興期に、なぜ僕らは漢字の変換候補をちまちま探してるのか。azooKeyというIMEがこの地獄から救ってくれそうなので紹介したい。
なんか凄そうだぞazooKey
MacでもWindowsでもIMEはGoogle日本語入力を何年も使っていたのだが、azooKeyというIMEを使い始めた。
未踏のプロジェクトという点で、若い天才が心血注いでるプロジェクトは期待がデカくなる。

ニューラルかな漢字変換システムを中核にした日本語入力体験が核で、このあたりの話はさくらの記事がわかりやすい。ちょうど放送大学で増井さんが担当するユーザインタフェースの授業で日本語入力周りの話も出ていたので面白く読めた。

Zennのほうの記事ではもう少し突っ込んだ話が書かれてあって、gpt-4oがゼロショットで最高成績を出してるあたりも面白い。Transformerの汎用的な能力が専門的なタスクで好成績を出したというのはgpt3頃からの有名な話なのですが最前線で体験されている感じ。

このZenzai以外で入力体験を支えているのがTunerというモジュールらしく、macのアクセシビリティ経由でコンテキストを取得しているようだ。
これらの技術を組みわせると何かワクワクするIMEが出来上がる。以下のポストのデモがとてもわかりやすい。
AI変換の新機能! pic.twitter.com/88xwMyAqkX
— Miwa - azooKeyの開発者 (@miwa_ensan) July 31, 2024
この変換精度は素晴らしく、mac標準のライブ変換は使いたくなかったレベルだったが、azooKeyのライブ変換はついに実用レベルに達したと感じた。
最高の入力体験を作るために慣用的な機能でも削る
azooKey導入者で結構戸惑う人が多いのが、mac標準やGoogle日本語入力とは違う挙動をするところだと思う。
例えば日本語入力の時にShiftキーを押しながらアルファベットの大文字を入力したら、その入力セッション中は英字モードのように振る舞う機能。設定で見当たらなかったのでおそらく誰かissue立ててるだろうなと思ったらやはり立っている。
ここでの議論は開発者のmiwaさんの主張もissueの起票者の主張も双方正しいところがとても重要で、確かにSHIFTの入力モードの挙動は機能的な一貫性で考えると不思議な挙動ではある。が、実際に日本語入力中にアルファベットの大文字を入力した場合は続く文字を小文字を入力したい場面が圧倒的に多く、だからこそこれまでのIMEはそのニーズに応える形でこの機能を実装していたのだろう。
開発者は議論の末にこの機能は採用しない決断をしている。この一時的に英字入力にする機能は確かにworkする場面は多いのかもしれないが、日本語入力中に突然"work"のようにかしこぶって小文字だけ入力するときは確かに自分も無意識に事前にモードを切り替えている。入力スタイルの振る舞いの一貫性を破ってアドホックな機能追加が必要なほどそれは重要な体験向上かと言われると微妙で、やはりユーザー側が矯正して入力の振る舞いを統一するほうがより良い方向性のように感じる。
新しいIMEを試すときに今までのIMEにある慣用的な機能の有無が大きい問題に感じてしまうが、大事なのは入力体験を向上させることであり、理想の入力体験い寄与しない機能はアプリケーションからも手続き記憶からも削ぎ落としたほうが良いということだ。
この辺の開発者の妥協のなさがプロダクトにさらに期待する部分なので、これからも応援しつつ便利に使わせてもらおうと思っている。おっさんなので慣れるの大変そうだけど。


ディスカッション