Optimized HRTF audio rendering in Siren. Now able to handle twice as many channels.

2013-03-06 15:46:54 -08:00
parent e30f90cc66
commit c2819acbad
5 changed files with 187 additions and 61 deletions
--- a/KREngine/kraken/KRAudioManager.cpp
+++ b/KREngine/kraken/KRAudioManager.cpp
@@ -44,7 +44,10 @@ ALvoid  alcMacOSXRenderingQualityProc(const ALint value);

 KRAudioManager::KRAudioManager(KRContext &context) : KRContextObject(context)
 {
+    mach_timebase_info(&m_timebase_info);
+    
    m_audio_engine = KRAKEN_AUDIO_SIREN;
+    m_high_quality_hrtf = false;
    
    m_listener_scene = NULL;
    
@@ -107,6 +110,9 @@ void KRAudioManager::setListenerScene(KRScene *scene)

 void KRAudioManager::renderAudio(UInt32 inNumberFrames, AudioBufferList *ioData)
 {
+    uint64_t start_time = mach_absolute_time();
+    
+    
 	AudioUnitSampleType *outA = (AudioUnitSampleType *)ioData->mBuffers[0].mData;
    AudioUnitSampleType *outB = (AudioUnitSampleType *)ioData->mBuffers[1].mData; // Non-Interleaved only
    
@@ -153,6 +159,12 @@ void KRAudioManager::renderAudio(UInt32 inNumberFrames, AudioBufferList *ioData)
            
        }
    }
+    
+    
+    uint64_t end_time = mach_absolute_time();
+    uint64_t duration = (end_time - start_time) * m_timebase_info.numer / m_timebase_info.denom; // Nanoseconds
+    uint64_t max_duration = (uint64_t)inNumberFrames * 1000000000 / 44100;
+//    fprintf(stderr, "duration: %lli  max_duration: %lli\n", duration / 1000, max_duration / 1000);
 }

 float *KRAudioManager::getBlockAddress(int block_offset)
@@ -789,6 +801,42 @@ DSPSplitComplex KRAudioManager::getHRTFSpectral(const KRVector2 &hrtf_dir, const
    return m_hrtf_spectral[sample_channel][dir];
 }

+KRVector2 KRAudioManager::getNearestHRTFSample(const KRVector2 &dir)
+{
+    float elev_gran = 10.0f;
+
+    
+    KRVector2 dir_deg = dir * (180.0f / M_PI);
+    float elevation = floor(dir_deg.x / elev_gran + 0.5f) * elev_gran;
+    if(elevation < -40.0f) {
+        elevation = -40.0f;
+    }
+    
+    KRVector2 min_direction;
+    bool first = true;
+    float min_distance;
+    for(std::vector<KRVector2>::iterator itr = m_hrtf_sample_locations.begin(); itr != m_hrtf_sample_locations.end(); itr++) {
+        if(first) {
+            first = false;
+            min_direction = (*itr);
+            min_distance = 360.0f;
+        } else if((*itr).x == elevation) {
+            float distance = fabs(dir_deg.y - (*itr).y);
+            if(min_distance > distance) {
+                min_direction = (*itr);
+                min_distance = distance;
+            }
+            distance = fabs(dir_deg.y - -(*itr).y);
+            if(min_distance > distance) {
+                min_direction = (*itr);
+                min_direction.y = -min_direction.y;
+                min_distance = distance;
+            }
+        }
+    }
+    return min_direction;
+}
+
 void KRAudioManager::getHRTFMix(const KRVector2 &dir, KRVector2 &dir1, KRVector2 &dir2, KRVector2 &dir3, KRVector2 &dir4, float &mix1, float &mix2, float &mix3, float &mix4)
 {
    float elev_gran = 10.0f;
@@ -1379,6 +1427,7 @@ void KRAudioManager::startFrame(float deltaTime)
 {
    m_mutex.lock();
    
+    // ----====---- Determine Ambient Zone Contributions ----====----
    m_ambient_zone_weights.clear();
    m_ambient_zone_total_weight = 0.0f; // For normalizing zone weights
    if(m_listener_scene) {
@@ -1407,7 +1456,7 @@ void KRAudioManager::startFrame(float deltaTime)
        }
    }
    
-    
+    // ----====---- Determine Reverb Zone Contributions ----====----
    m_reverb_zone_weights.clear();
    m_reverb_zone_total_weight = 0.0f; // For normalizing zone weights
    if(m_listener_scene) {
@@ -1435,6 +1484,61 @@ void KRAudioManager::startFrame(float deltaTime)
            }
        }
    }
+    
+    
+    
+    // ----====---- Map Source Directions and Gains ----====----
+    m_mapped_sources.clear();
+    
+    KRVector3 listener_right = KRVector3::Cross(m_listener_forward, m_listener_up);
+    std::set<KRAudioSource *> active_sources = m_activeAudioSources;
+    
+    
+    for(std::set<KRAudioSource *>::iterator itr=active_sources.begin(); itr != active_sources.end(); itr++) {
+        KRAudioSource *source = *itr;
+        KRVector3 source_world_position = source->getWorldTranslation();
+        KRVector3 diff = source_world_position - m_listener_position;
+        float distance = diff.magnitude();
+        float gain = source->getGain() * m_global_gain / pow(KRMAX(distance / source->getReferenceDistance(), 1.0f), source->getRolloffFactor());
+        
+        // apply minimum-cutoff so that we don't waste cycles processing very quiet / distant sound sources
+        gain = KRMAX(gain - KRENGINE_AUDIO_CUTOFF, 0.0f) / (1.0f - KRENGINE_AUDIO_CUTOFF);
+        
+        if(gain > 0.0f) {
+            
+            KRVector3 source_listener_space = KRVector3(
+                                                        KRVector3::Dot(listener_right, diff),
+                                                        KRVector3::Dot(m_listener_up, diff),
+                                                        KRVector3::Dot(m_listener_forward, diff)
+                                                        );
+            
+            
+            KRVector3 source_dir = KRVector3::Normalize(source_listener_space);
+            
+            
+            
+            if(source->getEnableOcclusion() && false) {
+                KRHitInfo hitinfo;
+                if(source->getScene().lineCast(m_listener_position, source_world_position, hitinfo, KRAKEN_COLLIDER_AUDIO)) {
+                    gain = 0.0f;
+                }
+            }
+            
+            KRVector2 source_dir2 = KRVector2::Normalize(KRVector2(source_dir.x, source_dir.z));
+            float azimuth = -atan2(source_dir2.x, -source_dir2.y);
+            float elevation = atan( source_dir.y / sqrt(source_dir.x * source_dir.x + source_dir.z * source_dir.z));
+            
+            KRVector2 adjusted_source_dir = KRVector2(elevation, azimuth);
+            
+            if(!m_high_quality_hrtf) {
+                adjusted_source_dir = getNearestHRTFSample(adjusted_source_dir);
+            }
+            
+            m_mapped_sources.insert(std::pair<KRVector2, std::pair<KRAudioSource *, float> >(adjusted_source_dir, std::pair<KRAudioSource *, float>(source, gain)));
+        }
+    }
+
+    
    m_mutex.unlock();
 }

@@ -1472,72 +1576,75 @@ void KRAudioManager::renderHRTF()
    int fft_size = 256;
    int fft_size_log2 = 8;
    
-    KRVector3 listener_right = KRVector3::Cross(m_listener_forward, m_listener_up);
-    
-    std::set<KRAudioSource *> active_sources = m_activeAudioSources;
-    
-    for(std::set<KRAudioSource *>::iterator itr=active_sources.begin(); itr != active_sources.end(); itr++) {
-        KRAudioSource *source = *itr;
-        KRVector3 source_world_position = source->getWorldTranslation();
-        KRVector3 diff = source_world_position - m_listener_position;
-        float distance = diff.magnitude();
-        float gain = source->getGain() * m_global_gain / pow(KRMAX(distance / source->getReferenceDistance(), 1.0f), source->getRolloffFactor());
-
-        // apply minimum-cutoff so that we don't waste cycles processing very quiet / distant sound sources
-        gain = KRMAX(gain - KRENGINE_AUDIO_CUTOFF, 0.0f) / (1.0f - KRENGINE_AUDIO_CUTOFF);
+    for(int channel=0; channel<impulse_response_channels; channel++) {
        
-        if(gain > 0.0f) {
+        bool first_source = true;
+        std::multimap<KRVector2, std::pair<KRAudioSource *, float> >::iterator itr=m_mapped_sources.begin();
+        while(itr != m_mapped_sources.end()) {
+            // Batch together sound sources that are emitted from the same direction
+            KRVector2 source_direction = (*itr).first;
+            KRAudioSource *source = (*itr).second.first;
+            float gain = (*itr).second.second;
+
            
-            KRVector3 source_listener_space = KRVector3(
-                KRVector3::Dot(listener_right, diff),
-                KRVector3::Dot(m_listener_up, diff),
-                KRVector3::Dot(m_listener_forward, diff)
-            );
-            
-            
-            KRVector3 source_dir = KRVector3::Normalize(source_listener_space);
-            
-            
-            
-            if(source->getEnableOcclusion() && false) {
-                KRHitInfo hitinfo;
-                if(source->getScene().lineCast(m_listener_position, source_world_position, hitinfo, KRAKEN_COLLIDER_AUDIO)) {
-                    gain = 0.0f;
-                }
+            if(first_source) {
+                // If this is the first or only sample, write directly to the first half of the FFT input buffer
+                source->sample(KRENGINE_AUDIO_BLOCK_LENGTH, 0, hrtf_sample->realp, gain);
+                first_source = false;
+            } else {
+                // Subsequent samples write to the second half of the FFT input buffer, which is then added to the first half (the second half will be zero'ed out anyways and works as a convenient temporary buffer)
+                source->sample(KRENGINE_AUDIO_BLOCK_LENGTH, 0, hrtf_sample->realp + KRENGINE_AUDIO_BLOCK_LENGTH, gain);
+                vDSP_vadd(hrtf_sample->realp, 1, hrtf_sample->realp + KRENGINE_AUDIO_BLOCK_LENGTH, 1, hrtf_sample->realp, 1, KRENGINE_AUDIO_BLOCK_LENGTH);
            }
            
-            KRVector2 source_dir2 = KRVector2::Normalize(KRVector2(source_dir.x, source_dir.z));
-            float azimuth = -atan2(source_dir2.x, -source_dir2.y);
-            float elevation = atan( source_dir.y / sqrt(source_dir.x * source_dir.x + source_dir.z * source_dir.z));
-            
-            float mix[4];
-            KRVector2 dir[4];
-            
-            
-            getHRTFMix(KRVector2(elevation, azimuth), dir[0], dir[1], dir[2], dir[3], mix[0], mix[1], mix[2], mix[3]);
-            
-            for(int channel=0; channel<impulse_response_channels; channel++) {
+            itr++;
+
+            bool end_of_group = false;
+            if(itr == m_mapped_sources.end()) {
+                end_of_group = true;
+            } else {
+                KRVector2 next_direction = (*itr).first;
+                end_of_group = next_direction != source_direction;
+            }
+
+            if(end_of_group) {
+                // ----====---- We have reached the end of a batch; convolve with HRTF impulse response and add to output accumulation buffer ----====----                
+                first_source = true;
                
-                memset(hrtf_accum->realp, 0, sizeof(float) * fft_size);
-                memset(hrtf_accum->imagp, 0, sizeof(float) * fft_size);
-                
-                for(int i=0; i < 4; i++) {
-                    if(mix[i] > 0.0f) {
-                        DSPSplitComplex hrtf_impulse_sample = getHRTFSpectral(dir[i], channel);
-                        vDSP_vsmul(hrtf_impulse_sample.realp, 1, mix+i, hrtf_impulse->realp, 1, fft_size);
-                        vDSP_vsmul(hrtf_impulse_sample.imagp, 1, mix+i, hrtf_impulse->imagp, 1, fft_size);
-                        vDSP_zvadd(hrtf_impulse, 1, hrtf_accum, 1, hrtf_accum, 1, fft_size);
-                    }
-                }
-                
-                source->sample(KRENGINE_AUDIO_BLOCK_LENGTH, 0, hrtf_sample->realp, gain);
                memset(hrtf_sample->realp + hrtf_frames, 0, sizeof(float) * hrtf_frames);
                memset(hrtf_sample->imagp, 0, sizeof(float) * fft_size);
                
+                DSPSplitComplex hrtf_spectral;
+                
+                if(m_high_quality_hrtf) {
+                    // High quality, interpolated HRTF
+                    hrtf_spectral= *hrtf_accum;
+                    
+                    float mix[4];
+                    KRVector2 dir[4];
+                    
+                    getHRTFMix(source_direction, dir[0], dir[1], dir[2], dir[3], mix[0], mix[1], mix[2], mix[3]);
+                
+                    
+                    memset(hrtf_accum->realp, 0, sizeof(float) * fft_size);
+                    memset(hrtf_accum->imagp, 0, sizeof(float) * fft_size);
+                    
+                    for(int i=0; i < 1 /*4 */; i++) {
+                        if(mix[i] > 0.0f) {
+                            DSPSplitComplex hrtf_impulse_sample = getHRTFSpectral(dir[i], channel);
+                            vDSP_vsmul(hrtf_impulse_sample.realp, 1, mix+i, hrtf_impulse->realp, 1, fft_size);
+                            vDSP_vsmul(hrtf_impulse_sample.imagp, 1, mix+i, hrtf_impulse->imagp, 1, fft_size);
+                            vDSP_zvadd(hrtf_impulse, 1, hrtf_accum, 1, hrtf_accum, 1, fft_size);
+                        }
+                    }
+                } else {
+                    // Low quality, non-interpolated HRTF
+                    hrtf_spectral = getHRTFSpectral(source_direction, channel);
+                }
                
                float scale = 0.5f / fft_size;
                vDSP_fft_zip(m_fft_setup, hrtf_sample, 1, fft_size_log2, kFFTDirection_Forward);
-                vDSP_zvmul(hrtf_sample, 1, hrtf_accum, 1, hrtf_convolved, 1, fft_size, 1);
+                vDSP_zvmul(hrtf_sample, 1, &hrtf_spectral, 1, hrtf_convolved, 1, fft_size, 1);
                vDSP_fft_zip(m_fft_setup, hrtf_convolved, 1, fft_size_log2, kFFTDirection_Inverse);
                vDSP_vsmul(hrtf_convolved->realp, 1, &scale, hrtf_convolved->realp, 1, fft_size);
                
--- a/KREngine/kraken/KRAudioManager.h
+++ b/KREngine/kraken/KRAudioManager.h
@@ -47,7 +47,7 @@ const int KRENGINE_AUDIO_BUFFERS_PER_SOURCE = 3;
 const int KRENGINE_AUDIO_BLOCK_LENGTH = 128; // Length of one block to process.  Determines the latency of the audio system and sets size for FFT's used in HRTF convolution
 const int KRENGINE_AUDIO_BLOCK_LOG2N = 7; // 2 ^ KRENGINE_AUDIO_BLOCK_LOG2N = KRENGINE_AUDIO_BLOCK_LENGTH

-const int KRENGINE_REVERB_MAX_FFT_LOG2 = 15;
+const int KRENGINE_REVERB_MAX_FFT_LOG2 = 17;
 const int KRENGINE_REVERB_WORKSPACE_SIZE = 1 << KRENGINE_REVERB_MAX_FFT_LOG2;

 const float KRENGINE_AUDIO_CUTOFF = 0.02f; // Cutoff gain level, to cull out processing of very quiet sounds
@@ -56,6 +56,9 @@ const int KRENGINE_REVERB_MAX_SAMPLES = 435200; // At least 10s reverb impulse r
 const int KRENGINE_MAX_REVERB_IMPULSE_MIX = 16; // Maximum number of impulse response filters that can be mixed simultaneously
 const int KRENGINE_MAX_OUTPUT_CHANNELS = 2;

+const int KRENGINE_MAX_ACTIVE_SOURCES = 24;
+const int KRENGINE_AUDIO_ANTICLICK_SAMPLES = 16;
+

 class KRAmbientZone;
 class KRReverbZone;
@@ -198,6 +201,7 @@ private:
    float *m_hrtf_data;
    map<KRVector2, DSPSplitComplex> m_hrtf_spectral[2];
    
+    KRVector2 getNearestHRTFSample(const KRVector2 &dir);
    void getHRTFMix(const KRVector2 &dir, KRVector2 &hrtf1, KRVector2 &hrtf2, KRVector2 &hrtf3, KRVector2 &hrtf4, float &mix1, float &mix2, float &mix3, float &mix4);
    KRAudioSample *getHRTFSample(const KRVector2 &hrtf_dir);
    DSPSplitComplex getHRTFSpectral(const KRVector2 &hrtf_dir, const int channel);
@@ -210,6 +214,12 @@ private:
    float m_reverb_zone_total_weight = 0.0f; // For normalizing zone weights
    
    boost::signals2::mutex m_mutex;
+    mach_timebase_info_data_t m_timebase_info;
+    
+    
+    std::multimap<KRVector2, std::pair<KRAudioSource *, float> > m_mapped_sources;
+    
+    bool m_high_quality_hrtf; // If true, 4 HRTF samples will be interpolated; if false, the nearest HRTF sample will be used without interpolation
 };

 #endif /* defined(KRAUDIO_MANAGER_H) */
--- a/KREngine/kraken/KRContext.cpp
+++ b/KREngine/kraken/KRContext.cpp
@@ -27,6 +27,12 @@ const char *KRContext::extension_names[KRENGINE_NUM_EXTENSIONS] = {
 };

 KRContext::KRContext() {
+    mach_timebase_info(&m_timebase_info);
+    
+    m_bDetectedExtensions = false;
+    m_current_frame = 0;
+    m_absolute_time = 0.0f;
+    
    m_pBundleManager = new KRBundleManager(*this);
    m_pShaderManager = new KRShaderManager(*this);
    m_pTextureManager = new KRTextureManager(*this);
@@ -37,9 +43,7 @@ KRContext::KRContext() {
    m_pAnimationCurveManager = new KRAnimationCurveManager(*this);
    m_pSoundManager = new KRAudioManager(*this);
    m_pUnknownManager = new KRUnknownManager(*this);
-    m_bDetectedExtensions = false;
-    m_current_frame = 0;
-    m_absolute_time = 0.0f;
+
 }

 KRContext::~KRContext() {
--- a/KREngine/kraken/KRContext.h
+++ b/KREngine/kraken/KRContext.h
@@ -86,6 +86,9 @@ private:
    
    long m_current_frame;
    float m_absolute_time;
+    
+    
+    mach_timebase_info_data_t    m_timebase_info;
 };

 #endif
--- a/KREngine/kraken/KREngine-common.h
+++ b/KREngine/kraken/KREngine-common.h
@@ -39,13 +39,13 @@ float const D2R = PI * 2 / 360;
 #include <unistd.h>
 #include <iostream>
 #include <math.h>
+#include <pthread.h>

 #include <boost/tokenizer.hpp>
 #include <boost/algorithm/string/predicate.hpp>
 #include <boost/signals2/mutex.hpp>


-
 using std::vector;
 using std::string;
 using std::set;
@@ -56,6 +56,8 @@ using std::queue;

 #ifdef __APPLE__
 #include "TargetConditionals.h"
+#include <mach/mach.h>
+#include <mach/mach_time.h>
 #include <Accelerate/Accelerate.h>
 #endif