ラベル カットアップ の投稿を表示しています。 すべての投稿を表示
ラベル カットアップ の投稿を表示しています。 すべての投稿を表示

2025年9月14日日曜日

LLMは接着が主役、カットアップは編集が主役

 カットアップは20世紀初頭のダダに源流があります。チューリヒのツァラは新聞を切って袋で混ぜ、取り出した順に詩を作る方法を示しました。のちにシュルレアリスムの偶然性や自動記述と響き合い、1959年にガイシンが偶然発見、60年代にはバロウズと共に本や録音テープを物理的に切断・貼り直す実験へ発展します。ジョン・ケージのチャンス・オペレーションや、制約で遊ぶオウリポとも連動し、「切って、並べ替えて、最小限だけ接ぐ」という編集術が確立しました。

LLMと比べると方向は逆です。LLMは大量の文章から「次に来そうな語」の確率分布を学び、アテンションで離れた文脈も結び、温度やtop-pで揺らぎを調整して、滑らかで一貫した文を作ります。要は“意味の糊で接ぐ”。一方カットアップは、人が句や文を切り、順序を入れ替え、必要なときだけ接続詞などで橋をかけます。工程で言えば、LLMは接着が主役、カットアップは編集が主役です。

両者には共通の物差しもあります。n-gramのパープレキシティ(読みやすさ)、境界PMI(継ぎ目の不自然さ)、隣り合う文の埋め込み距離(意味の飛距離)、出典の混合度(キメラ性)などです。実務では、断片を長く・橋渡し語を多くすれば「読めるキメラ」、断片を短く・順序をランダム寄りに・温度を上げれば「尖ったキメラ」になります。

後半の視点として、離散モデルはカットアップに近い作法を持ちます。n-gramやHMM、挿入・削除・置換を扱う確率的トランスデューサ、マスクした範囲を復元するBART/T5、まとめて穴埋めする非自回帰系や離散拡散は、いずれも「離散的な断片を壊し、選び、並べる」手続きです。逆に、密なアテンションで連続的に補間し、温度を下げ、強い整合制約をかけるほど、カットアップ的な断続は後景に退きます。

https://it-lists.blogspot.com/2025/09/llms-make-adhesion-protagonist-while.html

2025年8月24日日曜日

ウィリアム・S・バロウズのカットアップ技法

 

歴史的背景・起源

  • ダダからビートへ – カットアップは文学において第一次世界大戦後のダダに端を発し、トリスタン・ツァラが帽子から言葉を引く実験(1920年代)で試みられたja.wikipedia.org。その後、アンドレ・ブルトンらシュルレアリスムにも影響を与えつつ、1950年代に画家・作家のブライオン・ガイシンが新聞記事を切って並べ替える発見をし、『Minutes To Go』などで完成度を高めたja.wikipedia.org。アルゼンチンのフリオ・コルタサルも小説『レオナルドとアイネ・クルト』などでカットアップを利用しておりja.wikipedia.org、英米の前衛文学へと波及した。

  • ガイシンとバロウズ – 1959年、モロッコのタンジェでガイシンは偶然テーブル下の新聞が興味深い並びになったことから手法を確立し、ビート・ジェネレーションの拠点だったパリのビート・ホテルでウィリアム・バロウズに紹介したja.wikipedia.org。バロウズは以後、印刷物や録音にカットアップを適用し、「現在をカットすれば未来(の秘密)が漏れてくる」と語るなど、カットアップに秘められた新しい意味や予言性を探究したja.wikipedia.org

  • 第三の眼(The Third Mind) – 1977年にはバロウズとガイシンがエッセイ集『The Third Mind』を刊行し、カットアップ/フォールドイン技法の理論や実践例をまとめた。これらの発表により、バロウズは自身の独自理論として「言語はウイルスであり、テキストを再構築することで新たな現実が顕現する」と主張し、後の反文化運動や実験文学に大きな影響を与えたja.wikipedia.orgen.wikipedia.org

カットアップ技法の方法とプロセス

  • 紙面の切断と再配置 – 印刷済みの文章(新聞や本など)を物理的に切り刻み、それらを無作為に並べ替えて新しい文章を作る。バロウズは「ページを縦横に切り分け、4つのセクションを入れ替えれば新しいページができる」と説明しwriting.upenn.edu、実際に1枚の紙を十字に裁断して断片をシャッフルし、タイプライターで再構成していたja.wikipedia.orgwriting.upenn.edu。この手法により、意味のつながりが断片化され、偶然的・衝撃的な文が生まれる。

  • フォールドイン法 – 別々の2枚の文章をそれぞれ半分に折り、片方の半分ともう片方の半分を折り合わせて読む方法であるwriting.upenn.edukp4323w3255b5t267.hatenablog.com。バロウズは『第三の眼』で「片方のテキストのページを中央で折り、別のテキストの上に重ねる(fold-in)」と述べておりwriting.upenn.edu、この技法では切り貼りせずに折り合わせによって無関係の語句が奇妙に結びつき、新たな文脈が生まれるkp4323w3255b5t267.hatenablog.com

  • コラージュ的要素と偶然性 – カットアップは絵画でのモンタージュやフロッタージュと同様に、異質な要素をぶつけ合わせるコラージュ的手法の一種であるkp4323w3255b5t267.hatenablog.com。漆原正曉(山形浩生)によれば、「カットアップは紙を切り刻むことで偶然性を導入する乱暴な手法」でありkp4323w3255b5t267.hatenablog.com、カットされた文章は“言語上のカット&ペースト”とも呼ばれるkp4323w3255b5t267.hatenablog.com。ガイシン自身はこの手法を「超編集術」と評し、無意識やサブリミナルな情報がテキスト中に偶然に顕現する可能性を説いたkp4323w3255b5t267.hatenablog.com

バロウズ作品におけるカットアップの実例

  • 『ソフト・マシーン』(1961年) – バロウズの小説で、ノヴァ三部作の第一部。原書は「カットアップ技法を用いて組み立てられた」とされ、既存の原稿や『言語の倉庫』の断片を含めて切り貼りされたen.wikipedia.org。物語自体も覚醒剤中毒者の意識を散文的に断片化しており、言語の共有コードや支配構造を「破壊」することを狙った実験的スタイルとなっているen.wikipedia.org

  • 『ノヴァ急報』(Nova Express, 1964年) – 同三部作の第二部。本作ではバロウズとガイシンが開発した「フォールドイン」法(折り込み法)を用いて執筆したen.wikipedia.org。例えば、一枚の新聞ページを対角線に折り畳み、元々無関係な語句を隣接させて読ませることで、新奇なテキストが生成されている。作品は言語を使った支配(ノヴァ・モブによるマインドコントロール)をテーマにしており、バロウズはテキスト中に折りたたみ線を意識的に挿入している。

  • 『爆発する切符』(The Ticket That Exploded, 1962年) – 三部作の第三部で、バロウズはここでも折り込み法を多用したen.wikipedia.org。この作品では「言語は宇宙からのウイルス」というバロウズの思想が明確に描かれ、作中の登場人物が意図的にカットアップを実行する場面も登場するen.wikipedia.org。先行する2作や本作自身の断片が繰り返し再構成され、物語的連続性よりも偶発的・詩的なテクスチャーが重視されている。

  • その他の例 – バロウズは短編や詩集にも断片的手法を取り入れており、『裸のランチ』(1959年)自体は直線的手法だが、完成後に挿入や切断を受けて非連続的な構造となった経緯がある。実験文学としての三部作やエッセイ集『The Third Mind』ja.wikipedia.orgには、バロウズ自身による技法解説や実演例が含まれており、信頼できる資料となっている。

参考文献: 以上の内容は、ダダイズムからビート・ジェネレーションに至るカットアップ技法の流れや、バロウズ自身による技法解説writing.upenn.edukp4323w3255b5t267.hatenablog.com、『ソフト・マシーン』『ノヴァ急報』『爆発する切符』各訳書の解説および評論en.wikipedia.orgen.wikipedia.orgen.wikipedia.orgなどに基づいてまとめた。

ざっくり言うと――「n-gram(マルコフ連鎖)系の確率的カットアップ」です。

 素材テキストを小片に分け、頻度前後の連接関係から遷移確率を作り、重み付きランダムで文章を伸ばし、**前処理(前選択)/後処理(後選択)**で狙いの文体に整えています。

何をしているか(一般化)

  1. 断片化
    文字 or 語の n-gram に分割(日本語なら分かち書きは任意)。

  2. 統計化
    出現回数(頻度)と隣接ペア(連接)をカウント=遷移表を作成。

  3. 生成(確率的連結)
    直前の断片に“つながりやすい”候補を重み付き乱択で選び、ランダムウォーク的に文を伸長。

  4. 制御(ルール)
    文頭/文末トークン、最大長、同語連続の禁止、句読点比率などで暴走や破綻を抑制。

  5. 前選択/後選択

    • 前選択:テーマに合う素材側の絞り込み(出典や語彙を偏らせる)。

    • 後選択:出力フィルタ(禁則語、品詞・語尾パターン、句読点整形、スコア閾値)で仕上げ。

技法名の言い換え

  • マルコフ連鎖テキスト生成(n-gram 言語モデル)

  • 連接表+重み付きサンプリングによる確率的再配列

  • ヒューリスティックな前処理/後処理による品質制御

要するに、「頻度×連接」をコアに、乱択で並べ直し、ルールで体裁を整える――これが一般的な骨格です。