<p dir="ltr"><br>
On Dec 30, 2015 3:17 PM, "Dave Morriss" <<a href="mailto:perloid@autistici.org">perloid@autistici.org</a>> wrote:<br>
> Using a recent HPR show in my podcast queue and running<br>
> echoprint-codegen on the entire thing I found I got a chunk of JSON with<br>
> metadata and a humongous fingerprint string.</p>
<p dir="ltr">After spending some time reading the sever-side code, I found out the "fingerprint" is an encoded (details in an upcoming episode) list of timestamped "onset events" from the audio, which is why the lengths are correlated.</p>
<p dir="ltr">That list then has to be fuzzy (fuzzily?) matched against a candidate (essentially by counting how many events it has in common and whether they occur the same distance apart; again, more details to come).</p>
<p dir="ltr">> Then I started wondering how much you'd need to chop off a new show<br>
> given that any intro might be in a multitude of formats and of a<br>
> variable length.</p>
<p dir="ltr">The codegen tool uses ffmpeg, so it should support a lot of formats out of the box. And if we're only checking whether the very beginning of an upload matches the intro, selecting a good sample shouldn't be too hard.</p>
<p dir="ltr">> Then I realised I was probably out of my depth.</p>
<p dir="ltr">You and I both. Fortunately (unfortunately?) that hasn't stopped me yet.</p>
<p dir="ltr">> I'll be fascinated to know how people cleverer than I am work this out,<br>
> and look forward to the show on it!</p>
<p dir="ltr">You know what they say: give a man a hammer and he'll fish for nails, teach a man to code, and he'll waste hours using awk to analyse audio and misquoting proverbs.<br>
</p>