“ちゃんと設計された” 整数の加算回路は複数ビット先のキャリーを低遅延で出せることに価値があるので、全加算器を連ねただけのナイーブな加算回路を比較対象として想像すること自体が不適切で、そこから話を始めないといけない
16ビット先のキャリーを低遅延で計算する回路コストと32ビット先のキャリーを低遅延で計算する回路コストは線形な増加はしていない気がするので。 (自分で書いたことはないが組み合わせの数の問題なので雑な推定はできる)
プログラム側のステップ数の話ならナイーブな実装相当になるから削減幅は大きそうに見えるが、メリットが回路規模の削減なのに対してデメリットは計算時間 (所要サイクル数) の増加とプログラムサイズの増加の2つになるので、実は後者も整数の幅に対して線形なコスト増加ではなさそうな気がする。実物なしに考えてもたぶん結論でなそう