livetrax/libs/audiographer/private/limiter/limiter.cc

/*
 * Copyright (C) 2010-2018 Fons Adriaensen <fons@linuxaudio.org>
 * Copyright (C) 2021 Robin Gareus <robin@gareus.org>
 *
 * This program is free software; you can redistribute it and/or modify
 * it under the terms of the GNU General Public License as published by
 * the Free Software Foundation; either version 3 of the License, or
 * (at your option) any later version.
 *
 * This program is distributed in the hope that it will be useful,
 * but WITHOUT ANY WARRANTY; without even the implied warranty of
 * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
 * GNU General Public License for more details.
 *
 * You should have received a copy of the GNU General Public License
 * along with this program.  If not, see <http://www.gnu.org/licenses/>.
 */

#include <algorithm>
#include <assert.h>
#include <math.h>
#include <string.h>

#include "private/limiter/limiter.h"

using namespace AudioGrapherDSP;

void
Limiter::Histmin::init (int hlen)
{
	assert (hlen <= SIZE);
	_hlen = hlen;
	_hold = hlen;
	_wind = 0;
	_vmin = 1;
	for (int i = 0; i < SIZE; i++) {
		_hist[i] = _vmin;
	}
}

float
Limiter::Histmin::write (float v)
{
	int i    = _wind;
	_hist[i] = v;

	if (v <= _vmin) {
		_vmin = v;
		_hold = _hlen;
	} else if (--_hold == 0) {
		_vmin = v;
		_hold = _hlen;
		for (int j = 1 - _hlen; j < 0; j++) {
			v = _hist[(i + j) & MASK];
			if (v < _vmin) {
				_vmin = v;
				_hold = _hlen + j;
			}
		}
	}
	_wind = ++i & MASK;
	return _vmin;
}

Limiter::Upsampler::Upsampler ()
	: _nchan (0)
	, _z (0)
{
}

Limiter::Upsampler::~Upsampler ()
{
	fini ();
}

void
Limiter::Upsampler::fini ()
{
	for (int i = 0; i < _nchan; ++i) {
		delete[] _z[i];
	}
	delete[] _z;
	_nchan = 0;
	_z     = 0;
}

void
Limiter::Upsampler::init (int nchan)
{
	fini ();

	_nchan = nchan;
	_z     = new float*[nchan];
	for (int i = 0; i < _nchan; ++i) {
		_z[i] = new float[48];
		for (int j = 0; j < 48; ++j) {
			_z[i][j] = 0.0f;
		}
	}
}

float
Limiter::Upsampler::process_one (int chn, float const x)
{
	float* r = _z[chn];
	float  u[4];
	r[47] = x;
	/* 4x upsample for true-peak analysis, cosine windowed sinc
	 *
	 * This effectively introduces a latency of 23 samples, however
	 * the lookahead window is longer. Still, this may allow some
	 * true-peak transients to slip though.
	 * Note that digital peak limit is not affected by this.
	 */
	/* clang-format off */
	u[0] = r[47];
	u[1] = r[ 0] * -2.330790e-05f + r[ 1] * +1.321291e-04f + r[ 2] * -3.394408e-04f + r[ 3] * +6.562235e-04f
	     + r[ 4] * -1.094138e-03f + r[ 5] * +1.665807e-03f + r[ 6] * -2.385230e-03f + r[ 7] * +3.268371e-03f
	     + r[ 8] * -4.334012e-03f + r[ 9] * +5.604985e-03f + r[10] * -7.109989e-03f + r[11] * +8.886314e-03f
	     + r[12] * -1.098403e-02f + r[13] * +1.347264e-02f + r[14] * -1.645206e-02f + r[15] * +2.007155e-02f
	     + r[16] * -2.456432e-02f + r[17] * +3.031531e-02f + r[18] * -3.800644e-02f + r[19] * +4.896667e-02f
	     + r[20] * -6.616853e-02f + r[21] * +9.788141e-02f + r[22] * -1.788607e-01f + r[23] * +9.000753e-01f
	     + r[24] * +2.993829e-01f + r[25] * -1.269367e-01f + r[26] * +7.922398e-02f + r[27] * -5.647748e-02f
	     + r[28] * +4.295093e-02f + r[29] * -3.385706e-02f + r[30] * +2.724946e-02f + r[31] * -2.218943e-02f
	     + r[32] * +1.816976e-02f + r[33] * -1.489313e-02f + r[34] * +1.217411e-02f + r[35] * -9.891211e-03f
	     + r[36] * +7.961470e-03f + r[37] * -6.326144e-03f + r[38] * +4.942202e-03f + r[39] * -3.777065e-03f
	     + r[40] * +2.805240e-03f + r[41] * -2.006106e-03f + r[42] * +1.362416e-03f + r[43] * -8.592768e-04f
	     + r[44] * +4.834383e-04f + r[45] * -2.228007e-04f + r[46] * +6.607267e-05f + r[47] * -2.537056e-06f;
	u[2] = r[ 0] * -1.450055e-05f + r[ 1] * +1.359163e-04f + r[ 2] * -3.928527e-04f + r[ 3] * +8.006445e-04f
	     + r[ 4] * -1.375510e-03f + r[ 5] * +2.134915e-03f + r[ 6] * -3.098103e-03f + r[ 7] * +4.286860e-03f
	     + r[ 8] * -5.726614e-03f + r[ 9] * +7.448018e-03f + r[10] * -9.489286e-03f + r[11] * +1.189966e-02f
	     + r[12] * -1.474471e-02f + r[13] * +1.811472e-02f + r[14] * -2.213828e-02f + r[15] * +2.700557e-02f
	     + r[16] * -3.301023e-02f + r[17] * +4.062971e-02f + r[18] * -5.069345e-02f + r[19] * +6.477499e-02f
	     + r[20] * -8.625619e-02f + r[21] * +1.239454e-01f + r[22] * -2.101678e-01f + r[23] * +6.359382e-01f
	     + r[24] * +6.359382e-01f + r[25] * -2.101678e-01f + r[26] * +1.239454e-01f + r[27] * -8.625619e-02f
	     + r[28] * +6.477499e-02f + r[29] * -5.069345e-02f + r[30] * +4.062971e-02f + r[31] * -3.301023e-02f
	     + r[32] * +2.700557e-02f + r[33] * -2.213828e-02f + r[34] * +1.811472e-02f + r[35] * -1.474471e-02f
	     + r[36] * +1.189966e-02f + r[37] * -9.489286e-03f + r[38] * +7.448018e-03f + r[39] * -5.726614e-03f
	     + r[40] * +4.286860e-03f + r[41] * -3.098103e-03f + r[42] * +2.134915e-03f + r[43] * -1.375510e-03f
	     + r[44] * +8.006445e-04f + r[45] * -3.928527e-04f + r[46] * +1.359163e-04f + r[47] * -1.450055e-05f;
	u[3] = r[ 0] * -2.537056e-06f + r[ 1] * +6.607267e-05f + r[ 2] * -2.228007e-04f + r[ 3] * +4.834383e-04f
	     + r[ 4] * -8.592768e-04f + r[ 5] * +1.362416e-03f + r[ 6] * -2.006106e-03f + r[ 7] * +2.805240e-03f
	     + r[ 8] * -3.777065e-03f + r[ 9] * +4.942202e-03f + r[10] * -6.326144e-03f + r[11] * +7.961470e-03f
	     + r[12] * -9.891211e-03f + r[13] * +1.217411e-02f + r[14] * -1.489313e-02f + r[15] * +1.816976e-02f
	     + r[16] * -2.218943e-02f + r[17] * +2.724946e-02f + r[18] * -3.385706e-02f + r[19] * +4.295093e-02f
	     + r[20] * -5.647748e-02f + r[21] * +7.922398e-02f + r[22] * -1.269367e-01f + r[23] * +2.993829e-01f
	     + r[24] * +9.000753e-01f + r[25] * -1.788607e-01f + r[26] * +9.788141e-02f + r[27] * -6.616853e-02f
	     + r[28] * +4.896667e-02f + r[29] * -3.800644e-02f + r[30] * +3.031531e-02f + r[31] * -2.456432e-02f
	     + r[32] * +2.007155e-02f + r[33] * -1.645206e-02f + r[34] * +1.347264e-02f + r[35] * -1.098403e-02f
	     + r[36] * +8.886314e-03f + r[37] * -7.109989e-03f + r[38] * +5.604985e-03f + r[39] * -4.334012e-03f
	     + r[40] * +3.268371e-03f + r[41] * -2.385230e-03f + r[42] * +1.665807e-03f + r[43] * -1.094138e-03f
	     + r[44] * +6.562235e-04f + r[45] * -3.394408e-04f + r[46] * +1.321291e-04f + r[47] * -2.330790e-05f;
	/* clang-format on */

	for (int i = 0; i < 47; ++i) {
		r[i] = r[i + 1];
	}

	float p1 = std::max (fabsf (u[0]), fabsf (u[1]));
	float p2 = std::max (fabsf (u[2]), fabsf (u[3]));
	return std::max (p1, p2);
}

Limiter::Limiter (void)
    : _fsamp (0)
    , _nchan (0)
    , _truepeak (false)
    , _dly_buf (0)
    , _zlf (0)
    , _rstat (false)
    , _peak (0)
    , _gmax (1)
    , _gmin (1)
{
}

Limiter::~Limiter (void)
{
	fini ();
}

void
Limiter::set_inpgain (float v)
{
	_g1 = powf (10.f, 0.05f * v);
}

void
Limiter::set_threshold (float v)
{
	_gt = powf (10.f, -0.05f * v);
}

void
Limiter::set_release (float v)
{
	if (v > 1.f) {
		v = 1.f;
	}
	if (v < 1e-3f) {
		v = 1e-3f;
	}
	_w3 = 1.f / (v * _fsamp);
}

void
Limiter::set_truepeak (bool v)
{
	if (_truepeak == v) {
		return;
	}
	_upsampler.init (_nchan);
	_truepeak = v;
}

void
Limiter::init (float fsamp, int nchan)
{
	if (nchan == _nchan) {
		return;
	}

	fini ();

	if (nchan == 0) {
		return;
	}

	_fsamp = fsamp;

	if (fsamp > 130000) {
		_div1 = 32;
	} else if (fsamp > 65000) {
		_div1 = 16;
	} else {
		_div1 = 8;
	}

	_nchan = nchan;
	_div2  = 8;
	int k1 = (int)(ceilf (1.2e-3f * fsamp / _div1));
	int k2 = 12;
	_delay = k1 * _div1;

	int dly_size;
	for (dly_size = 64; dly_size < _delay + _div1; dly_size *= 2) ;


	_dly_mask = dly_size - 1;
	_dly_ridx = 0;

	_dly_buf = new float*[_nchan];
	_zlf     = new float[_nchan];

	for (int i = 0; i < _nchan; i++) {
		_dly_buf[i] = new float[dly_size];
		memset (_dly_buf[i], 0, dly_size * sizeof (float));
		_zlf[i] = 0.f;
	}

	_hist1.init (k1 + 1);
	_hist2.init (k2);

	_c1  = _div1;
	_c2  = _div2;
	_m1  = 0.f;
	_m2  = 0.f;
	_wlf = 6.28f * 500.f / fsamp;
	_w1  = 10.f / _delay;
	_w2  = _w1 / _div2;
	_w3  = 1.f / (0.01f * fsamp);
	_z1  = 1.f;
	_z2  = 1.f;
	_z3  = 1.f;
	_gt  = 1.f;
	_g0  = 1.f;
	_g1  = 1.f;
	_dg  = 0.f;

	_peak = 0.f;
	_gmax = 1.f;
	_gmin = 1.f;
}

void
Limiter::fini (void)
{
	for (int i = 0; i < _nchan; i++) {
		delete[] _dly_buf[i];
		_dly_buf[i] = 0;
	}
	delete[] _dly_buf;
	delete[] _zlf;
	_zlf   = 0;
	_nchan = 0;
}

/*
 * _g1 : input-gain (target)
 * _g0 : current gain (LPFed)
 * _dg : gain-delta per sample, updated every (_div1 * _div2) samples
 *
 * _gt : threshold
 *
 * _m1 : digital-peak (reset per _div1 cycle)
 * _m2 : low-pass filtered (_wlf) digital-peak (reset per _div2 cycle)
 *
 * _zlf[] helper to calc _m2 (per channel LPF'ed input) with input-gain applied
 *
 * _c1 : coarse chunk-size (sr dependent), count-down _div1
 * _c2 : 8x divider of _c1 cycle
 *
 * _h1 : target gain-reduction according to 1 / _m1 (per _div1 cycle)
 * _h2 : target gain-reduction according to 1 / _m2 (per _div2 cycle)
 *
 * _z1 : LPFed (_w1) _h1 gain (digital peak)
 * _z2 : LPFed (_w2) _h2 gain (_wlf filtered digital peak)
 *
 * _z3 : actual gain to apply (max of _z1, z2)
 *       falls (more gain-reduction) via _w1 (per sample);
 *       rises (less gain-reduction) via _w3 (per sample);
 *
 * _w1 : 10 / delay;
 * _w2 : _w1 / _div2
 * _w3 : user-set release time
 *
 * _dly_ridx: offset in delay ringbuffer
 * ri, wi; read/write indices
 */
void
Limiter::process (int nframes, float const* inp, float* out)
{
	int   ri, wi;
	float h1, h2, m1, m2, z1, z2, z3, pk, t0, t1;

	ri = _dly_ridx;
	wi = (ri + _delay) & _dly_mask;
	h1 = _hist1.vmin ();
	h2 = _hist2.vmin ();
	m1 = _m1;
	m2 = _m2;
	z1 = _z1;
	z2 = _z2;
	z3 = _z3;

	if (_rstat) {
		_rstat = false;
		pk     = 0;
		t0     = _gmax;
		t1     = _gmin;
	} else {
		pk = _peak;
		t0 = _gmin;
		t1 = _gmax;
	}

	int k = 0;
	while (nframes) {
		int   n = (_c1 < nframes) ? _c1 : nframes;
		float g = _g0;
		for (int j = 0; j < _nchan; j++) {
			float z = _zlf[j];
			float d = _dg;
			g       = _g0;
			for (int i = 0; i < n; i++) {
				float x = g * inp[j + (i + k) * _nchan];
				g += d;
				_dly_buf[j][wi + i] = x;
				z += _wlf * (x - z) + 1e-20f;

				if (_truepeak) {
					x = _upsampler.process_one (j, x);
				} else {
					x = fabsf (x);
				}

				if (x > m1) {
					m1 = x;
				}
				x = fabsf (z);
				if (x > m2) {
					m2 = x;
				}
			}
			_zlf[j] = z;
		}
		_g0 = g;

		_c1 -= n;
		if (_c1 == 0) {
			m1 *= _gt;
			if (m1 > pk) {
				pk = m1;
			}
			h1  = (m1 > 1.f) ? 1.f / m1 : 1.f;
			h1  = _hist1.write (h1);
			m1  = 0;
			_c1 = _div1;
			if (--_c2 == 0) {
				m2 *= _gt;
				h2  = (m2 > 1.f) ? 1.f / m2 : 1.f;
				h2  = _hist2.write (h2);
				m2  = 0;
				_c2 = _div2;
				_dg = _g1 - _g0;
				if (fabsf (_dg) < 1e-9f) {
					_g0 = _g1;
					_dg = 0;
				} else {
					_dg /= _div1 * _div2;
				}
			}
		}

		for (int i = 0; i < n; i++) {
			z1 += _w1 * (h1 - z1);
			z2 += _w2 * (h2 - z2);
			float z = (z2 < z1) ? z2 : z1;
			if (z < z3) {
				z3 += _w1 * (z - z3);
			} else {
				z3 += _w3 * (z - z3);
			}
			if (z3 > t1) {
				t1 = z3;
			}
			if (z3 < t0) {
				t0 = z3;
			}
			for (int j = 0; j < _nchan; j++) {
				out[j + (k + i) * _nchan] = z3 * _dly_buf[j][ri + i];
			}
		}

		wi = (wi + n) & _dly_mask;
		ri = (ri + n) & _dly_mask;
		k += n;
		nframes -= n;
	}

	_m1 = m1;
	_m2 = m2;
	_z1 = z1;
	_z2 = z2;
	_z3 = z3;

	_dly_ridx = ri;
	_peak     = pk;
	_gmin     = t0;
	_gmax     = t1;
}