quarta-feira, 22 de agosto de 2018

Reconhecimento de voz fácil no PCLinuxOS!

 
Reconhecimento de voz é um dos aspectos mais interessantes da computação. Grandes avanços foram alcançados nos últimos anos.

E, estes avanços foram repassadas à computação pessoal. Ou seja, o que se conseguiu com pesquisa e Tecnologia de reconhecimento de voz, chegou aos usuários domésticos.

O reconhecimento de voz é uma característica que pode ser usada para melhoria de acessibilidade, ou mesmo, quando se está cansado de digitar textos muito grandes.

Sim poder descansar as mãos depois de digitar muitos textos é algo extremamente confortável.

E, os usuários de outros sistemas operacionais podem desfrutar de reconhecimento de voz facilmente. No Windows há o Dragon naturally speaking.

No Mac, Dictanote e WordQ SpeakQ. Mas e no Linux?

No Linux nós temos diversos mecanismos de reconhecimento de voz.

No entanto, geralmente eles são extremamente complicados de fazer funcionar.

Geralmente, são Soluções quê precisam do pocketsphinx, que é um engine de reconhecimento de voz e de text-to-speech.

Mas, nada temam, pois a tecnologia de reconhecimento de voz avançou muito, graças ao Google (agora Alphabet Company), e, podemos nós, usuários do PCLinuxOS, aproveitar essas benesses do maior sistema de buscas da internet.

A Infraestrutura de reconhecimento de voz da Google na nuvem, Google cloud voice API

O Google  abriu sua nova Cloud Speech API - anunciada no evento NEXT em São Francisco - para uma prévia limitada para desenvolvedores em 2016.

Essa tecnologia de reconhecimento de fala foi desenvolvida e já é usada por vários produtos do Google há algum tempo, como o mecanismo de pesquisa do Google, no qual existe a opção de fazer pesquisa por voz.

A capacidade de converter voz em texto é baseada em redes neurais profundas, algoritmos de aprendizado de máquina de última geração recentemente demonstraram ser particularmente eficazes para a detecção de padrões em sinais de áudio e vídeo. A rede neural é atualizada conforme novas amostras de fala são coletadas pelo Google, para que novos termos sejam aprendidos e a precisão do reconhecimento continue aumentando. Essa tecnologia da Google é o que está por trás do Ok Google, no Android, no Google Chrome e no assistente virtual da Google, Google Assistant.
Com sua tecnologia de reconhecimento de voz na nuvem, a Google pretende rivalizar com a Nuance, fabricante do antigo Dragon Dictate do Windows (agora  Dragon naturally speaking).

Reconhecimento de voz na nuvem

Os recursos de voz para texto são usados em vários casos, incluindo assistentes inteligentes controlados por voz em dispositivos móveis, automação residencial, transcrição de áudio e classificação automática de chamadas telefônicas.

Agora que essa tecnologia estará acessível como um serviço em nuvem para desenvolvedores, permitirá que qualquer aplicativo integre reconhecimento de fala em texto, representando uma valiosa alternativa à tecnologia Nuance comum (usada pela Siri da Apple e pela S-Voice da Samsung, por exemplo) e desafiando outras soluções, como o Speech to text do IBM Watson e o Microsoft Bing Speech API.

Agora, como nos beneficiar do Google Cloud Voice Recognition ?


É possível desfrutar das vantagens que a Google integra aos seus produtos, pois diversos sites oferecem o serviço de reconhecimento de voz, através da Google cloud voice API.
Para aproveitar esses serviços, você vai precisar de uma conexão com a internet, um microfone ligado ao seu computador e usar o navegador Google Chrome. A seguir, a análise destes serviços.






https://speechnotes.co
O Speechnotes é um poderoso bloco de anotações on-line habilitado para fala, projetado para capacitar suas ideias através da implementação de um design limpo e eficiente, para que você possa se concentrar em seus pensamentos.
O pessoal do site se esforça para fornecer a melhor ferramenta de ditado on-line, envolvendo tecnologia de reconhecimento de fala de ponta para os resultados mais precisos que a tecnologia pode alcançar hoje, além de incorporar ferramentas internas (automáticas ou manuais) para aumentar a eficiência, produtividade e conforto dos usuários.
Funciona totalmente online no seu navegador Chrome. Sem download, sem instalação e sem necessidade de registro, você pode começar a trabalhar imediatamente.

Minha avaliação: Suporta Português Brasileiro e mais de 40 idiomas, salva para o Google drive, e, se você assinar o serviço da empresa, pode acessar seus documentos de qualquer máquina logada em sua conta. Já usei e o reconhecimento de voz é rápido e preciso. Funciona no Google Chrome e com celulares também.








https://www.speechtexter.com/
O SpeechTexter é um conversor profissional de fala online para texto, destinado a simplificar e acelerar o seu trabalho.
A empresa deseja fornecer a melhor experiência de transcrição on-line usando uma tecnologia inovadora de reconhecimento de fala com resultados de alta precisão. Esta tecnologia é suportada apenas pelo navegador do Google Chrome para computadores. Outros navegadores ainda não implementaram reconhecimento de fala. Nenhum registro é necessário, então você pode começar a trabalhar imediatamente.

Minha avaliação: Suporta Português Brasileiro e mais de 40 idiomas, salva como TXT, imprime ou copia para a área de transferência (clipboard). Não tem inscrição, ou seja, só pode ser usado em uma máquina por vez. Nos meus testes, foi um pouco mais lento do que o Speechnotes.








https://www.textfromtospeech.com
Este utilitário é um leitor de voz / fala para texto. O que isso significa? Isso significa que você pode simplesmente ditar um texto e ele será escrito sem levantar um dedo.

Tem os seguintes recursos:
    • Grátis e online
    • Nenhum download, instalação ou registro. Multiplataforma
    • Suporta apenas 7 idiomas (e Português Brasileiro não é um deles)
    • Você pode pausar ou parar o ditado (ele salva a posição da última palavra)
    • Reconhece comandos de voz para inserir pontuação: por exemplo, diga “Vírgula” e digite ","
    • Capitalização inteligente
    • Você pode salvar, copiar, imprimir ou enviar o texto ditado.
     
      Minha avaliação: Como não suporta Português Brasileiro, não o testei. Mas, parece ser o serviço com menos recursos, dentre os avaliados.



       



https://dictation.io/
O dictation.io  pode reconhecer e transcrever idiomas populares, incluindo inglês, espanhol, francês, italiano, português, e muito mais. A lista completa de idiomas suportados pode ser conferida aqui: https://dictation.io/languages

Você pode adicionar novos parágrafos, sinais de pontuação, smileys e outros caracteres especiais usando comandos de voz simples. Por exemplo, diga "Nova linha" para mover o cursor para a próxima lista ou diga "Rosto Sorridente" para inserir :-) smiley. Possui uma lista de comandos suportados.

Minha avaliação: Permite realizar diversas ações com o texto que foi reconhecido: Copiar para o clipboard, salvar como .TXT, mandar como Tweet, enviar por e-mail, imprimir ou exportar como PDF, ou fazer o computador ditar o  texto que você ditou anteriormente. Em termos de velocidade, se assemelha ao  Speechnotes.

Assim, há até mais opções do que estas quatro analisadas, mas, requereriam mais tempo de pesquisa para suas análises. O que importa é que, se você precisar ditar textos extensos, o PCLinuxOS pode ajudar a realizar a tarefa. Reconhecimento de voz, o Linux não é mais um cidadão de segunda classe.

Ok ?

Espero que tenham gostado, e, este texto foi produzido com o auxílio do Speechnotes e, editado no Libre Office depois.

Aproveitem essas novas capacidades, e, até mês que vem!

quinta-feira, 26 de julho de 2018

You Tube Parte 6: O Epílogo


Este é o capítulo final da série sobre o YouTube, o epílogo.

Nestes 6 meses discorremos sobre diversos emuladores, programas de áudio e vídeo que auxiliam na feitura de vídeos para o YouTube. 


Recapitulando, na tabela abaixo segue a relação dos programas que foram abordados e sua utilidade:

Progama
Utilidade
DosBOX
Gera vídeos de jogos e programas DOS
OpenMSX
Linha de computadores MSX
Hatari
Linha de computadores Atari ST
Ep128Emu
Linha de computadores Spectrum e Armstrad
MAME
Diversos Arcades
Audacity
Editor de áudio, normaliza, tira ruídos
jPSXdec
Extrai filmes e áudios de jogos do PS1
Rezound
Outro editor de áudio, melhora o som e aplica efeitos
Mednafen
Uma dezena de sistemas
Simple Screen Recorder
Poderoso software de captura de telas.


Assim vimos todos estes programas que auxiliam na criação de vídeos. No entanto, algumas regras devem ser seguidas para o envio de vídeos do YouTube e obviamente sua monetização.

As regras do YouTube

Deve se ter um cuidado muito especial com material que tenha  copyright: Músicas licenciadas, outros videoclipes que tenham o material sob copyright e afins.
A regra de ouro aqui é: Músicas com direitos autorais registrados serão sempre desmonetizadas.
Eu voltarei a esse assunto logo em seguida.
Outros detalhes a serem cuidados no YouTube são vídeos com nudez, palavrões e incitação ao ódio racial, sexual ou religioso.
No caso de músicas com copyright, a dica é silenciar essas músicas quando aparecerem no vídeo. Ou, você perde a monetização deste vídeo.
O tão afamado Fair Use é algo incerto no You Tube, pois já houve diversos casos de paródias e outros usos que cairiam no Fair Use e os vídeos foram removidos. Diria que é uma área muito cinza do You Tube, e, não se pode ter certeza de nada. No entanto, o You Tube não é mais aquele, e, o excessivo zelo com copyright, censura e novas regras  estão atingindo em cheio os pequenos criadores de conteúdo.

Há algo de podre na You Tube lândia…

Ora, como citei acima, copyright strikes estão dificultando o trabalho no You Tube. Como mencionei o Fair Use, não há uma regra clara, e, muitos materiais que cairiam nessa classificação, ou são removidos ou são desmonetizados. Agora, o You Tube atira primeiro e pergunta depois: Primeiro seu vídeo é, ou desmonetizado ou retirado do ar, para depois ser julgado o mérito do strike. E, a tecnologia de Content ID é abusada por grandes empresas: Mesmo com o You Tube criando uma “rede de segurança” para os criadores de conteúdo, só que não funciona para grandes empresas, apenas pequenos copyright trolls. Mas, não fica só nisso: Essas mesmas empresas, que clamam por direitos de copyright, usam da mesma ferramenta de Content ID para silenciar críticas ruins de seus produtos ou quando You Tubers levantam assuntos negativos sobre essas empresas.
E, a coisa fica pior: Dependendo das palavras chaves do seu vídeo, o You Tube também não vai monetizar seu vídeo, graças a uma política de vídeos advertiser-friendly, que corta a monetização de vídeos com palavras-chave polêmicas, claramente feito por robôs, mas, que ataca conteúdo legítimo e deixa passar muita coisa ruim.

O Copyright abusado…

As leis de copyright estão completamente obsoletas e fundamentalmente quebradas. Para se ter uma ideia, vamos tomar um videogame(poderia ser um filme, também), como o famoso game que saiu no Playstation 1, Tony Hawk’s Pro Skater. Existem dezenas de músicas licenciadas nesse game, tais como: The Suicide Machines - "New Girl", Goldfinger – "Superman", Speedealer - "Screamer/Nothing to Me", Dead Kennedys - "Police Truck", Primus - "Jerry Was a Race Car Driver", entre tantas outras músicas famosas, e, a produtora Activision pagou aos artistas quando o jogo foi feito. Agora, se você fizer um vídeo gameplay sobre este jogo, como o jogo é, com toda a sua trilha sonora intacta, o Content ID do  You Tube vai captar todas as músicas, e, reverter a monetização para os detentores do copyright de cada uma delas. Ou seja, você teve o trabalho de fazer o jogo funcionar, capturou toda a filmagem, editou o material bruto num programa próprio e ainda upou o vídeo e, não vai receber nada por ele, enquanto os detentores do copyright vão levar toda a monetização do vídeo, sem suar nem nada, todo o seu trabalho. E, os dignos autores recebem parte desse montante, mas, depende da companhia que administra os direitos. É ridículo ver como lutam os copyright maximalists, quando algumas pessoas ficam recebendo direitos eternamente, e, ao mesmo tempo travam a evolução cultural, afinal, tudo que existe é um mashup.

As leis de copyright tem que ser reformadas, pois hoje, atendem mais a grandes grupos, e menos a artistas e autores, já que seu rendimento é marginal, enquanto os grupos detentores dos direitos levam a parte do leão. Mas, graças a Disney, as coisas não vão mudar tão cedo não (vamos esperar por 2023, quando Mickey entra no domínio público...).
Mas, por conta dessas políticas do You Tube, não faço vídeos sobre esse jogo (Tony Hawk’s Pro skater).

Logan Paul e a desmonetização dos canais pequenos

O You Tube também desferiu um pesado golpe nos criadores de conteúdo pequenos, em Fevereiro de 2018, com novas regras para monetização.
Depois de um vídeo controvertido, do You Tuber Logan Paul, o YouTube mudou as regras de monetização: A partir de 20 de fevereiro de 2018, somente os canais que foram visualizados por 4.000 horas e que tenham 1.000 inscritos exclusivos nos últimos 12 meses poderão hospedar anúncios e compartilhar a receita. Isso está sendo visto como um avanço significativo em relação aos padrões introduzidos em abril passado, que exigiam mais seguidores, mas não definiam um padrão para o tempo de exibição. Mas, de qualquer forma, o You Tube está penalizando os pequenos criadores de conteúdo, e, favorecendo os grandes canais, que tem uma produção muito mais cara e profissional, com equipes de produção e mais gente trabalhando nos vídeos. Não mais o cara fazendo um vídeo no seu quarto e mandando para o You Tube, o que é uma triste realidade, quando a You Tube tenta asfixiar justamente aqueles que fizeram dele um serviço tão popular. A ordem agora é privilegiar o conteúdo dito “profissional” e advertiser-friendly em detrimento de canais pequenos. Tristemente, essa tendência, que vinha desde 2012, e, culminou com os vídeos sem noção de Logan Paul, e, por conta de seu impacto, foi chamado de “adpocalypse”.
O chamado Adpocalypse foi tão severo, que ensejou o famoso tiroteio em San Bruno, Califórnia, na sede do You Tube.
E, o You Tube lançou seu serviço de streaming pago, o You Tube Red, ou seja, mais indícios da direção que está seguindo agora.

Censura e Remoção de conteúdo

Censura e remoção de conteúdo também piorou recentemente, quando o You Tube começou a censurar vídeos que considera controversos, ou, para agradar o governo de certos países(China, Paquistão e etc…) .

A Conclusão

Como vimos acima, o panorama para quem está tentando entrar no You Tube agora é bastante desanimador: O You Tube está fechando as portas para os pequenos e tentando virar uma nova Netflix.
Nada contra mudar e expandir, mas, preservando seu público inicial. O You Tube hoje tenta, a toda força, tornar-se um veículo de comunicação como uma nova rede Globo, censurando e moldando sua audiência. Mas nós vivemos em outros tempos, não na época da alienação, mas, da informação. É bem mais difícil agora, que o gênio saiu da garrafa, tentar enganar todo mundo de novo. Mas, o You Tube tenta, com a promoção de vídeos de gatinhos e conteúdo alienante e censurando conteúdo que considera polêmico. Agora, quem está acima do bem e do mal para julgar outros ? Discursos de ódio são uma coisa, mas opiniões são outra. E, com qual medida o You Tube julga uns e outros ? Robôs principalmente, o que induz ao erro. E, para piorar as coisas, You Tube está investindo 25 milhões de dólares para que “fontes confiáveis” de jornalismo “tradicional” possam melhor aproveitar a sua plataforma, ao mesmo tempo combatendo as chamadas fake news… Oras, a mídia tradicional é a maior fabricante de factoides e fake news, então, espere mais censura e remoção de conteúdos.
O You Tube, no entanto, fez um gesto interessante de boa vontade, para auxiliar os pequenos canais: A Assinatura paga, onde usuários tem a opção de contribuir para o canal que assinam. E, como esse  “aperto” nos pequenos canais já vem de algum tempo, os criadores de conteúdo se voltam a plataformas de crowd funding, como o Patreon, para poder manter seus ganhos e continuar com seus canais.
Realmente, essa nova política do You Tube é muito deprimente, visto que muitas pessoas passaram a viver do You Tube, tirando seu sustento e de suas famílias desse serviço. Eu mesmo já me acostumei a ver mais os meus canais de notícia no You Tube, do que as vias tradicionais. E, tudo isso pode estar ameaçado agora.

Mas, não temam: Há saídas. O You Tube não é o único, e, há serviços novos como o D-Tube, cujo visual é muito parecido com o You Tube, sem as restrições ideológicas. E o Twitch TV também está acumulando cada vez mais criadores de conteúdo, oriundos do êxodo do You Tube.
Então, se o You Tube não cuidar e preservar seus talentos, vai acabar como as mídias tradicionais: Mais um canal de TV a cabo, com muito conteúdo desinteressante, enquanto seus maiores bens(os criadores de conteúdo) terão migrado para outras praias.
Futuramente, escreverei sobre as alternativas ao You Tube, que, existem, e, dependendo do que se quer fazer, em termos artísticos e de expressão, podem ser muito melhores que o You Tube.

Gente, tudo o que escrevi nesta série de artigos, testei no meu canal do You Tube: 

 https://www.youtube.com/channel/UC84De8g52Z0C5YzubnICzKg

Então, se você estiver disposto a ver tudo o que eu escrevi em ação, de verdade, dê uma olhada no meu canal, e se você se sentir inclinado, assine-o.

sexta-feira, 22 de junho de 2018

You Tube Parte 5


Neste artigo discorrerei sobre duas ótimas ferramentas para criação de vídeos: Mednafen (multiemulador) e Simple Screen Recorder.

Mednafen
Mednafen é um versátil multiemulador para o PCLinuxOS. Ele emula 10 sistemas diferentes, com diversos cores de emulação, sendo alguns exclusivos, enquanto outros foram incorporados ao projeto.

Systema Baseado no core:
Atari Lynx Handy
Game Boy Advance VisualBoyAdvance
Neo Geo Pocket Color Neopop
Nintendo Entertainment System FCE Ultra
Super Nintendo Entertainment System bsnes
Nintendo Virtual Boy Original. NEC V810 CPU core based on Reality Boy.
PC Engine Original. CD-ROM interface based on PC2e.
PC-FX Original. NEC V810 CPU core based on Reality Boy.
PlayStation Original.
WonderSwan Color Cygne
Sega Genesis Genesis Plus
Sega Master System and Game Gear SMS Plus
Sega Saturn Original.



Não é, no entanto, um emulador qualquer: Mednafen tem características que o tornam único:
    • Suporte físico para joystick / gamepad.
    • Sistema de configuração de entrada versátil; atribuir vários botões físicos a um botão ou ação virtual.
    • Vários filtros gráficos e modos de dimensionamento.
    • Salvar estados.
    • Rebobinagem de jogos em tempo real.
    • Capturas de tela, salvas no formato PNG.
    • Gravação de filmes no formato QuickTime.
    • Registro de som no formato MS WAV.
    • Carregando jogos de arquivos compactados gzip e (pk) zip.
    • Reprodução em rede (utilizando um programa de servidor dedicado externo).
    • Suporte a trapaças (cheats) incorporado
    • Suporte a patches on the fly, para jogos individualmente.
O que nos interessa é a sua capacidade de gravar filmes de gameplay no formato Quick time (Apple MOV).

Para tanto, é necessário invocar o Mednafen pela linha de comando.

Então, para capturar um vídeo gameplay, o seguinte comando deve ser entrado por um terminal:

$ mednafen -qtrecord nome_do_video.mov arquivo de rom ou iso do jogo que se quer filmar.

Exemplo:

Para gravar um gameplay do Sonic, do Mega Drive, o comando seria mednafen -qtrecord sonic.mov sonic.gen

O vídeo do gameplay será gravado na pasta onde o Mednafen for invocado.

Agora, algumas configurações devem ser feitas, para ajustar a gravação ao hardware que se tem.

Abra o arquivo mednafen.cfg,  que fica na pasta .mednafen, na /home do usuário, com o editor de texto plano de sua preferência.

No arquivo aberto, procure pela linha qtrecord.vcodec.

Nesta linha é definido o codec que será usado na caputra. Há 3 opções possíveis:
    • raw
    • cscd
    • png

RAW: O formato raw é um codec rápido, computacionalmente, mas causará um tamanho de arquivo enorme e pode exceder a taxa de gravação sustentada do seu meio de armazenamento.

CSCD - CamStudio Screen Codec :
Um bom equilíbrio entre desempenho e taxa de compressão, mas, ele exige uma máquina bastante potente (um Corei3 no mínimo), e, vai depender também de qual sistema será emulado, os sistemas de 32 bits exigirão mais potência de processamento. Como exemplo, uma captura de 15 minutos gerou um arquivo de 10GB.

PNG:
Tem uma taxa de compressão melhor do que "cscd", mas exige muito mais CPU, ou seja, você precisará de uma CPU bem mais potente. Se estiver sem espaço no HD, e, com uma boa CPU, poderá ser uma opção.

O arquivo de vídeo resultante deverá ser processado com um conversor, como o Winff (ou qualquer outro conversor de vídeo) para adaptar o vídeo a uma resolução usável para ser editado posteriormente.


Simple Screen Recorder(SSR)
É um software de screencast baseado em Qt feito para sistemas operacionais Linux, que foi criado como uma alternativa mais simples para programas como ffmpeg / avconv e VLC.

É um fantástico screen recorder, muito melhor que o Record my desktop(é capaz de gravar telas OpenGL), e, muito leve em recursos, tanto que é melhor do que alguns métodos de captura nativos, de outros programas que já abordei nessa série de artigos, que, causam um certo LAG quando gravando, ou, os arquivos resultantes são muito grandes. SSR consegue uma ótima relação entre recursos usados e tamanho de arquivo gerado.

Agora, vamos focar nas configurações do SSR.

Nota: Vou indicar as configurações para melhor performance em máquinas bem modestas (como é a máquina que uso para capturar meus gameplays).

SSR estará na seção Vídeo do menu de programas.

Tela inicial


Após a tela de abertura acima, clique em Continue.

Primeira tela de configurações

Aqui começamos a configurar como será a gravação. Você pode criar um profile, já com todas as configurações específicas e salvá-lo, não tendo que repetir o processo cada vez que for usar o programa. No meu caso, como não tenho muita variedade nas minhas gravações, não fiz um profile.

Primeiro, indique se será a gravação de uma tela inteira, ou apenas uma parte. SSR permite a gravação de uma parte ou de toda a tela, com ou sem o cursor.

Se quiser definir uma resolução, poderá fazê-lo nos campos Largura / Altura.
Defina a taxa de quadros (eu coloco sempre em 30, fica mais fácil para gerar vídeos depois).

Deixe desmarcado o Vídeo em escala, que esta opção gasta processamento do computador, já que cada quadro tem que ser processado individualmente, o que gera um LAG no processo.

Se quiser gravar o cursor, habilite esta opção.

Agora, o áudio.

Penso que gravar Gameplays, o áudio é indispensável (com cuidado com músicas comercias, mas, voltarei a esse assunto depois).

Bem, o SSR permite 3 backends possíveis para capturar áudio: Jack, Alsa e Pulseaudio.

Se você tem uma máquina bastante potente, o suficiente para rodar o jogo, o Pulseaudio e o SSR, esta é a opção mais simples. Basta selecionar Pulseaudio e indicar qual será a fonte de áudio e pronto, a gravação vai transcorrer sem problemas.

DETALHE: Se você for fazer uma narração, sobre o jogo ou o que seja que está capturando, grave o áudio numa trilha separada. Não grave sobre a trilha do jogo / programa que você está capturando.
É muito fácil de incorrer em algum problema, e por tudo a perder, enquanto a narração gravada em separado, você pode re fazer, remover ruídos ou cortar partes que não gostou, sem perder a trilha sonora do jogo  / programa que foi gravado. Eu, por exemplo, uso o meu celular para gravar meus voice-overs e depois edito e mixo no vídeo final.

Jack é mais complicado de fazer, mas, funciona muito bem, consome menos recursos que o Pulseaudio e tem uma qualidade muito boa. O PCLinuxOS já vem com o Jack2, a versão mais recente do Jack audio, e, você vai precisar também do QjackCtl, uma GUI que facilita o controle do Jack audio daemon (start / stop e configurações).

Agora abra o QJackCtl e, antes de fazer qualquer outra coisa, clique no botão de configurações. A maioria das configurações padrão está bem, você só precisa fazer algumas alterações:

    Certifique-se de que a caixa de seleção "realtime" esteja marcada, na aba parameters, e, na aba advanced, marque e a caixa de seleção "No Memory Lock " esteja desmarcada.

    Defina a  taxa para 44100, porque é isso que o SimpleScreenRecorder usará. Outras taxas de amostra ainda funcionarão, mas não é muito útil, já que o SimpleScreenRecorder irá redimensioná-lo para 44100 de qualquer maneira.

    Defina o tamanho do período para um valor razoável, por exemplo, 512 ou 1024. Valores menores diminuirão a latência, mas aumentarão a probabilidade de você obter xruns (cliques ou interrupções curtas no áudio). O melhor valor depende muito do seu hardware de som e do desempenho dos drivers do Linux para esse hardware. As placas de som USB geralmente apresentam melhor desempenho aqui. Com um kernel especial em tempo real e o hardware certo, você pode reduzir a latência para um milissegundo, mas eu não recomendo fazer isso: introduz muita sobrecarga, pode causar xruns e você provavelmente não notará a diferença de qualquer maneira, em latências  de 10ms ou menos.

    Defina o número de períodos como 2. Se isso não funcionar corretamente, mesmo com tamanhos de período muito grandes (ou seja, você ainda recebe xruns), tente 3 ou 4.

Configurando o Jack
    
Defina o número de canais de entrada e saída para 2, porque SimpleScreenRecorder atualmente suporta apenas estéreo.

Depois de escolher suas configurações, clique no botão '‘iniciar’' e aguarde alguns segundos. Se tudo correr bem, a exibição de status deve acender e conter apenas texto verde e amarelo. Se as coisas derem errado (você recebe xruns), o texto ficará vermelho.

Você deve sempre ter certeza de que o JACK está rodando antes de iniciar qualquer aplicativo que tente usar o JACK, porque eles podem tentar iniciar o JACK (em segundo plano), o que confundirá o QJackCtl (se isso acontecer, você deve encontrar o processo do jackd e matá-lo manualmente).

Você pode testar o JACK com qualquer aplicativo que tenha suporte a JACK (por exemplo, o Audacity). A maioria dos aplicativos normais não tem suporte a JACK, portanto, você precisará do que é chamado de ponte ALSA-para-JACK. Existem duas maneiras de fazer isso. O método clássico usa um dispositivo de loop ALSA. Ele sempre funciona, mas acrescenta muita latência que é irritante. Há uma solução muito melhor: o plugin JACK para o ALSA.
Para usar este plugin, é necessário instalar o pacote lib64alsa-plugins-jack. Este pacote habilita a saída PCM Jack, que pode ser usada pelo ALSA sem problemas.

Mas, para usá-lo, é necessário configurar o arquivo .asoundrc, na /home do usuário, e, rotear o áudio através do Jack para realizar a captura.

Crie então um arquivo .asoundrc com o conteúdo abaixo:

# override default
pcm.!default {
    type plug
    slave {
        pcm "rjack"
    }
}

# ALSA-to-JACK bridge
pcm.jack {
    type plug
    slave {
        pcm "rjack"
    }
    hint {
        description "JACK bridge"
    }
}
pcm.rjack {
    type jack
    playback_ports {
        0 "system:playback_1"
        1 "system:playback_2"
    }
    capture_ports {
        0 "system:capture_1"
        1 "system:capture_2"
    }
}

Isso fará com que o plugin JACK seja o dispositivo padrão ALSA. A maioria dos aplicativos simplesmente usa o padrão, então isso geralmente é tudo que você precisa fazer.
Alguns aplicativos podem ter uma maneira de selecionar a entrada / saída de som dentro do aplicativo; nesse caso, você deve usar 'default' ou selecionar manualmente 'jack_system'.

Agora você pode usar SimpleScreenRecorder com o backend JACK. SimpleScreenRecorder pode automaticamente fazer conexões para casos de uso comum (gravando o microfone e / ou os alto-falantes), mas se você precisar de um controle mais fino, você pode manualmente gerenciar conexões com QJackCtl clicando no botão 'conectar' (não confundir com o botão 'patchbay', que é usado para aplicar automaticamente conexões predefinidas).

Você também pode combinar SimpleScreenRecorder com vários outros aplicativos JACK para aplicar efeitos de áudio em tempo real.

Quando terminar com o JACK, primeiro feche todos os aplicativos que usam o sistema de som, exclua o arquivo .asoundrc em sua pasta pessoal (ou apenas renomeie-o para poder usá-lo novamente mais tarde) e interrompa o JACK via QjackCtl.


Configurando com Alsa
Usar o SSR com Alsa é a opção que menos carrega o sistema, e, bastante fácil de configurar.
Como funciona ?

Colocando-se a entrada de áudio como Alsa, o SSR vai capturar o áudio da fonte definida na caixa de diálogo Fonte, no caso da figura abaixo, [hw:0,0] HDA Intel ALC662 Rev1 Analog.



Ou seja, o SSR vai gravar o áudio dessa entrada de som Alsa no vídeo de gameplay.

Mas, será necessário plugar um cabo especial, P2 Y, para levar a saída de áudio para os falantes / fones externos, e, injetar o áudio na entrada especificada na configuração.


O cabo necessário se parece com o da figura abaixo.


Aconselho que injete o áudio na entrada MIC traseira, que é stereo, captura o som em dois canais, e, possui filtragem na entrada. Eu mesmo tentei injetar o áudio na entrada IN do computador, mas, o nível de ruído é muito alto. Na entrada MIC já há filtragem de capacitores, o que corta o nível de ruído para padrões aceitáveis.

Agora, configure os níveis no alsamixer, pressione F4, dispositivos de captura, e configure-os



Note que esta configuração é específica do meu setup. A sua poderá / deverá ser diferente, então, identificar quais são os dispositivos de MIC e configurar o dispositivo correto deverá ser feito antes de começar a gravação, sob pena do vídeo gameplay resultar mudo. A saída de volume, no meu caso, deixo em 86% do valor total, no controle de volume. Você poderá experimentar diferentes valores, para não deixar o áudio nem muito baixo, nem alto demais, com distorções.

Este tipo de setup é o que menos recursos consome do computador, já que apenas rodarão: a aplicação que você quer capturar e o SSR, ao contrário das outras opções, que envolvem dois ou mais daemons, que geram uma sobrecarga maior.

Agora, prosseguindo a configuração, pressione Continua no SSR, e, uma tela como a abaixo deverá aparecer


Selecione o profile YouTube, defina o nome do arquivo e onde será gravado, cheque as caixas Arquivo separado por segmento e Add timestamp.
Defina o container (eu sempre ponho MP4), o codec (h.264 é um padrão) e o preset (para gameplays Superfast  é o melhor).
O áudio (MP3) e o bit rate (eu costumo deixar em 160KBps).
Pressione continua, e, aparecerá a tela de início de gravação. Pressione Inicie a gravação e pronto, seu vídeo começará a ser gravado.



Quando terminar de gravar, se estiver satisfeito com o resultado, aperte em Salve a gravação, caso contrário, pressione Cancela a gravação.

Experimente com o SSR até achar uma configuração que julgue a melhor para seu caso, pois ele possui diversas configurações, e, o ajuste fino entre elas é o que produz um melhor resultado.

Assim terminamos mais um artigo da série do You Tube, e, no próximo mês teremos o capítulo final dessa série.

Espero que apreciem, até lá!