2017-12-20

EmscriptenでALLOW_MEMORY_GROWTH=1した時ハマった話

WebAssemblyをターゲットとしてEmscriptenを用いてビルドする場合には-s ALLOW_MEMORY_GROWTH=1を指定して自動的なメモリ領域の拡張を利用することができるが、その時思いがけない問題に遭遇したのでメモ。

状況

EmscriptenでコンパイルされるRustの関数に(C言語風の)数値の配列に対するポインタを渡したいと思って、次のようなコードを書いていた。

const f_ = Module.cwrap('_f', 'number', ['number']);

const f = (() => {
    const sizeofFloat32 = 4;
    const length = 3;
    const pointer = Module._malloc(sizeofFloat32 * length);
    const view = new Float32Array(Module.HEAPU8.buffer, pointer, length);

    return (a: number[]) => {
        view.set(a); // !!!

        f_(pointer);
    };
})();

このようにArrayBufferViewをクロージャを使ってガメておけば、オブジェクト生成のコストがなくってTypedArray.prototype.setを使うことができて便利だと思っていたが、このコードはまれにview.set(a);のところでエラーを吐いて死ぬ。

エラー

このときに出力されたエラーメッセージはこのようであった。

Uncaught TypeError: Cannot perform %TypedArray%.prototype.set on a detached ArrayBuffer

TypedArrayが detachedなステートになってしまったらしい。

ArrayBuffer.transfer()

developer.mozilla.org

ArrayBufferにはtransferというメソッドが生えていて、C言語で言うところのreallocのように、引数として取るArrayBufferに結びついたViewをDetached状態にし、指定したサイズのArrayBufferを新しく返すというメソッドがある。

何が起きていたのか

コンパイルされたjsのコードからメモリ拡張部分のコードを抜き出すとこうなっている。

  var wasmReallocBuffer = (function (size) {
    var PAGE_MULTIPLE = Module["usingWasm"] ? WASM_PAGE_SIZE : ASMJS_PAGE_SIZE;
    size = alignUp(size, PAGE_MULTIPLE);
    var old = Module["buffer"];
    var oldSize = old.byteLength;
    if (Module["usingWasm"]) {
      try {
        var result = Module["wasmMemory"].grow((size - oldSize) / wasmPageSize); // WebAssembly.Memory.prototype.grow
        if (result !== (-1 | 0)) {
          return Module["buffer"] = Module["wasmMemory"].buffer // Updating Module['buffer']
        } else {
          return null
        }
      } catch (e) {
        return null
      }
    } else {
      exports["__growWasmMemory"]((size - oldSize) / wasmPageSize);
      return Module["buffer"] !== old ? Module["buffer"] : null
    }
  });
  Module["reallocBuffer"] = (function (size) {
    if (finalMethod === "asmjs") {
      return asmjsReallocBuffer(size)
    } else {
      return wasmReallocBuffer(size)
    }
  });
function enlargeMemory() {
  var PAGE_MULTIPLE = Module["usingWasm"] ? WASM_PAGE_SIZE : ASMJS_PAGE_SIZE;
  var LIMIT = 2147483648 - PAGE_MULTIPLE;
  if (HEAP32[DYNAMICTOP_PTR >> 2] > LIMIT) {
    return false
  }
  var OLD_TOTAL_MEMORY = TOTAL_MEMORY;
  TOTAL_MEMORY = Math.max(TOTAL_MEMORY, MIN_TOTAL_MEMORY);
  while (TOTAL_MEMORY < HEAP32[DYNAMICTOP_PTR >> 2]) {
    if (TOTAL_MEMORY <= 536870912) {
      TOTAL_MEMORY = alignUp(2 * TOTAL_MEMORY, PAGE_MULTIPLE)
    } else {
      TOTAL_MEMORY = Math.min(alignUp((3 * TOTAL_MEMORY + 2147483648) / 4, PAGE_MULTIPLE), LIMIT)
    }
  }
  var replacement = Module["reallocBuffer"](TOTAL_MEMORY);
  if (!replacement || replacement.byteLength != TOTAL_MEMORY) {
    TOTAL_MEMORY = OLD_TOTAL_MEMORY;
    return false
  }
  updateGlobalBuffer(replacement); // Update Module['buffer']
  updateGlobalBufferViews(); // Update HEAP***
  return true
}

コードを読んだ感じだとModule['buffer']を書き換えているし、WebAssembly.Memory.prototype.growが自身のbufferを別物にすり替えることがあるらしい*1。内部でArrayBuffer.transferを呼んでいると考えると今回のエラーの説明がつく。WebAssembly.Memoryの実装はまだ読んでいないので、確定的なことはなんとも言えないけど。

結論

どうやら、Emscriptenの管理しているヒープはそもそも別オブジェクトにすり替わったりするので、クロージャの内部に持ったりすることが無いようにしなければならないようだ。呼び出す側から持たせるデータはポインタのみにして、毎回毎回ArrayBufferViewを作り直すか、Module.setValue等で各要素書き込んでやるなどする必要がありそうだ。少しつらい気持ちになった。

*1:Cのrealloc()が別のポインタを返す事があることを考えれば自然ではある、同じ場所で連続なメモリを確保できるとは限らないし

2017-12-04

Rustでヒストリー機能実装

Rust プログラミング

non-takuwan.hatenablog.com 一晩寝たらRustの件については解決した。

こうする。

struct Context {
    state: State,
    history_manager: HistoryManager,
}

trait Action {
    fn do_undo(state: &mut State);
}

struct HistoryManager {
    ...
    undo_list: Vec<Box<Action>>,
    ...
}

impl HistoryManager {
    pub fn do_undo(state: &mut State) {
        if let Some(mut action) = self.undo_list.pop() {
            action.do_undo(state);
        }
    }
}

fn do_undo(context: &mut Context) {
    let mut history_manager = &mut context.history_manager;
    let mut state = &mut context.state;
    history_manager.do_undo(state);
}

#[no_mangle]
pub unsafe fn c_do_undo(context: *mut Context) {
    do_undo(&mut *context);
}

Contextへ二重の&mut借用が問題になっているのではなく、ホントはHistoryManagerへの&mut借用が問題になってたんだという事に気がついた。Undo/Redo時にActionがHistoryManagerを変更する必要がないので、これで構わない。

一晩かかると辛いので、パッとわかるようになりたい。他のふたつも解決したいけど、もうちょい難しそうでこれもまた若干辛い。

2017-12-04

数学の勉強が必要だと思った話

Rust プログラミング数学記号論理学 Haskell

人生何度目かわからないが、今日、数学の勉強をする必要があると再認識した。

シチュエーション

僕は今、初心者ながらRustで編集のヒストリー機能を実装している。他の言語では幾度となく実装してきたような機能だが、Rustでやるとなると、どのように実装してよいかよくわからなくなってしまった。僕はデザインパターンには明るくないが、おそらく「コマンドパターン」と呼ばれるものを実装しようとしていた*1。また、現在実装しているRustのコードはCとしてのAPIを持ち、外から呼び出せるようになっていて、そのために現在の状態が全てContextと呼ばれる構造体に押し込められている*2。アンドゥ操作はこのContextに対して行われるものであると見ることができる。そこで、普通に実装しようと思うと以下のようなコードになる。

struct Context {
    ...
    history_manager: HistoryManager,
    ...
}

trait Action {
    fn do_undo(context: &mut Context);
}

struct HistoryManager {
    ...
    undo_list: Vec<Box<Action>>,
    ...
}

impl HistoryManager {
    pub fn do_undo(context: &mut Context) {
        if let Some(mut action) = self.undo_list.pop() {
            action.do_undo(context);
        }
    }
}

fn do_undo(context: &mut Context) {
    let mut history_manager = &mut context.history_manager;
    history_manager.do_undo(context); // ERROR!!
}

#[no_mangle]
pub unsafe fn c_do_undo(context: *mut Context) {
    do_undo(&mut *context);
}

しかし（当然ながら？）、このコードはコンパイルが通らない。// ERROR!!とコメントを付けた行で二回目の&mutの借用が生じるからだ。

解決策として、ぱっと思いつくものには次のようなものがある。

ContextをRc<RefCell<Context>>とする
Box<Action>をRc<RefCell<Action>>とする
「コマンドパターン」を使うことをやめる

ここまで考えると、これ以上考えが進まなくなってしまった。本当に「コマンドパターン」を実装するためにはRc<RefCell<T>>は必要なのか？僕の実装が「ヘタクソ」なだけで、本当は素朴な借用のみで実装できてしまうのではないだろうか？という疑問が生じてしまったのだ。

素朴な借用のみを用いて「コマンドパターン」を実装することはできるのか。しばらく考えたが、出た答えは「多分出来ない」だった。「コマンドパターン」を実装する際には、どこかしらに同一オブジェクトに対する複数の参照が同時に存在してしまうような「気がした」

しかし、安易にRefCellを使うのは、ただごまかしているだけだ。理屈ではよくわからないから、実行時に本当に借用できるかどうか、サイコロを振っているようなものだ。なるべくRefCellを使わないほうが「Rustっぽい」やりかたなのではないだろうか。

もやもやして非常に気持ちが悪い。「Rustの借用を用いるという枠組みの中でコマンドパターンを実装することができるかどうか」証明できれば良いのだが。

デジャヴ

直観主義論理

大学の教養の授業の中で直観主義論理に触れる機会があった。ちょっと練習問題を解き、簡単な証明図を書くことができるようになった。この練習問題の中には「古典論理を用いないと証明できないものであるので帰結の二重否定を証明せよ」というものもあった。

ここで、今回と同じような疑問が生じた。直観主義論理で証明できないのはなぜか？本当に古典論理が必要なのだろうか？もやもやする。でも、証明図を考えてみると「多分できない」と思った。なんだか、うまく否定をキャンセルすることができないのだ。

ポイントフリースタイル

Haskellというプログラミング言語があるが、プログラムの書き方の流儀（？）にポイントフリースタイルというものがある。「一般的な」書き方からポイントフリースタイルに書き換えるのはパズルのようなもので、解説を追い、少しだけ練習してみたことがある。この練習中にまた疑問が生じた、ポイントフリースタイルへの書き換えにおいてflipがよく用いられているが、flipを用いずに、練習問題の題材となっていた関数をポイントフリースタイルへ書き換えることは不可能なのだろうか？ほかに用いられている「もっと単純そうな」関数(.)、($)、idでflipを表現することは出来ないのだろうか？というものだ。

これについてもちょっと考えてみたのだが、どうにもこれらの関数では実現することが出来ないように思えた。引数を「ひっくり返す」ことを表現する能力は、これらの関数とカリー化と部分適用の組み合わせには「なさそう」だ。でも、本当に表現できないのだろうか？自分が十分に頭が良ければ、これらの関数の組み合わせでflipを表現できたのではないだろうか？もやもやする。Googleで検索しても、みんな当たり前のようにflipを使っている。機械的にポイントフリースタイルに変換するプログラムも当たり前のようにflipを出力する。これらは簡潔に表現するために用いられているのだろうか？それとも「ほんとうに必要」だから用いられてるのだろうか？もやもやする。うう。

結局

これらの３つのケースは自分の数学力の欠如が現れた似たようなケースであったように思う。こういう状況を解決することができれば、何もかもスッキリして最高なのだが。

一番手をつけやすいのは２番めの論理の例かなと思っている。記号論理学には教科書があるし、確実な「解答」がありそうで、きちんと勉強しなおせばきっと理解できるはずだ。

ヒマと本を買うお金と理解する能力とモチベがあれば勉強したい。できるかな？つらそう。

*1:https://crates.io/crates/undoというcrateがあったが、あまり参考にならなかった

*2:このようなAPIを持つ一例としてDuktapeなど

2017-11-29

はじめに

最近、いろいろ喋りたい欲求でメチャクチャになっていた。ホントはちゃんとまとめたほうがいい内容を、ツイッターに延々ダラダラ垂れ流しているのではあまりにもだらしないので、ブログを作った。

ホントはJekyllでページ生成してGitHub Pagesでサーブするっていうのが理想だったんだけれども、良いテーマが見つからないし、コメント欄とかを用意するのも若干手間なもんだから、はてなブログにした。他に良さげなサービスも見当たらなかったし。

はてなダイアリーは10年以上前にちょっと使ってたことがあって、当時から圧倒的進化を遂げていてメッチャ感動している。

おそらく技術っぽいことを書く予定。もしかしたらその他の趣味っぽいことばっかりになるかもしれない。