Amazon Sagemaker articles

9/26/2023 • EN

Llama 2 on Amazon SageMaker a Benchmark

A benchmark analysis of deploying Meta's Llama 2 models on Amazon SageMaker using Hugging Face's LLM Inference Container, evaluating cost, latency, and throughput.

Amazon Sagemaker benchmark large language models Llama 2 Model Deployment

Philipp Schmid

9/12/2023 • EN

Fine-tune Falcon 180B with QLoRA and Flash Attention on Amazon SageMaker

A technical guide on fine-tuning the massive Falcon 180B language model using QLoRA and Flash Attention on Amazon SageMaker.

Amazon Sagemaker Falcon 180b Flash Attention LLM Fine Tuning Qlora

Philipp Schmid

9/7/2023 • EN

Deploy Falcon 180B on Amazon SageMaker

A technical guide on deploying the Falcon 180B open-source large language model to Amazon SageMaker using the Hugging Face LLM DLC.

Amazon Sagemaker Falcon 180b Hugging Face LLM Deployment Text Generation Inference

Philipp Schmid

8/7/2023 • EN

Deploy Llama 2 7B/13B/70B on Amazon SageMaker

A technical guide on deploying Meta's Llama 2 large language models (7B, 13B, 70B) on Amazon SageMaker using the Hugging Face LLM DLC.

Amazon Sagemaker Hugging Face Llama 2 LLM Deployment Text Generation Inference

Philipp Schmid

7/18/2023 • EN

Fine-tune LLaMA 2 (7-70B) on Amazon SageMaker

A technical guide on fine-tuning LLaMA 2 models (7B to 70B) using QLoRA and PEFT on Amazon SageMaker for efficient large language model adaptation.

Amazon Sagemaker Llama 2 Model Fine Tuning Peft Qlora

Philipp Schmid

7/13/2023 • EN

Train LLMs using QLoRA on Amazon SageMaker

A technical guide on using QLoRA to efficiently fine-tune the Falcon 40B large language model on Amazon SageMaker.

Amazon Sagemaker Hugging Face LLM Fine Tuning Parameter Efficient Fine Tuning Qlora

Philipp Schmid

6/28/2023 • EN

Optimize and Deploy BERT on AWS inferentia2

A tutorial on optimizing and deploying a BERT model for low-latency inference using AWS Inferentia2 accelerators and Amazon SageMaker.

Amazon Sagemaker AWS Inferentia2 Bert Machine Learning Deployment Model Optimization

Philipp Schmid

6/20/2023 • EN

Securely deploy LLMs inside VPCs with Hugging Face and Amazon SageMaker

A technical guide on deploying open-source Large Language Models (LLMs) from Amazon S3 to Amazon SageMaker using Hugging Face's LLM Inference Container within a VPC.

Amazon Sagemaker AWS Vpc Hugging Face LLM Deployment Model Inference

Philipp Schmid

6/7/2023 • EN

Deploy Falcon 7B and 40B on Amazon SageMaker

A technical guide on deploying the open-source Falcon 7B and 40B large language models to Amazon SageMaker using the Hugging Face LLM Inference Container.

Amazon Sagemaker Falcon 40b Hugging Face LLM Inference Model Deployment

Philipp Schmid

5/31/2023 • EN

Introducing the Hugging Face LLM Inference Container for Amazon SageMaker

Guide to deploying open-source LLMs like BLOOM and Open Assistant to Amazon SageMaker using Hugging Face's new LLM Inference Container.

Amazon Sagemaker Hugging Face large language models LLM Inference Text Generation Inference

Philipp Schmid

5/23/2023 • EN

Generative AI for Document Understanding with Hugging Face and Amazon SageMaker

Tutorial on fine-tuning and deploying the Donut model for OCR-free document understanding using Hugging Face and Amazon SageMaker.

Amazon Sagemaker Document Understanding Fine Tuning generative ai Hugging Face

Philipp Schmid

5/2/2023 • EN

How to scale LLM workloads to 20B+ with Amazon SageMaker using Hugging Face and PyTorch FSDP

A technical tutorial on fine-tuning a 20B+ parameter LLM using PyTorch FSDP and Hugging Face on Amazon SageMaker's multi-GPU infrastructure.

Amazon Sagemaker Hugging Face large language models Model Fine Tuning Pytorch Fsdp

Philipp Schmid

4/13/2023 • EN

Train and Deploy BLOOM with Amazon SageMaker and PEFT

A technical guide on fine-tuning the BLOOMZ language model using PEFT and LoRA techniques, then deploying it on Amazon SageMaker.

Amazon Sagemaker Bloom Lora Model Deployment Peft

Philipp Schmid

3/20/2023 • EN

Deploy FLAN-UL2 20B on Amazon SageMaker

A technical guide on deploying Google's FLAN-UL2 20B large language model for real-time inference using Amazon SageMaker and Hugging Face.

Amazon Sagemaker Hugging Face Inference Machine Learning Model Deployment

Philipp Schmid

2/22/2023 • EN

Combine Amazon SageMaker and DeepSpeed to fine-tune FLAN-T5 XXL

Guide to fine-tuning the large FLAN-T5 XXL model using Amazon SageMaker managed training and DeepSpeed for optimization.

Amazon Sagemaker Deepspeed Fine Tuning Flan T5 large language models

Philipp Schmid

2/8/2023 • EN

Deploy FLAN-T5 XXL on Amazon SageMaker

A technical guide on deploying the FLAN-T5-XXL large language model for real-time inference using Amazon SageMaker and Hugging Face.

Amazon Sagemaker Flant5 Hugging Face Inference Model Deployment

Philipp Schmid

11/1/2022 • EN

Stable Diffusion on Amazon SageMaker

A technical guide on deploying the Stable Diffusion text-to-image model to Amazon SageMaker for real-time inference using the Hugging Face Diffusers library.

Amazon Sagemaker Hugging Face Machine Learning Model Deployment stable diffusion

Philipp Schmid

5/31/2022 • EN

Advanced PII detection and anonymization with Hugging Face Transformers and Amazon SageMaker

A technical guide on using Hugging Face Transformers and Amazon SageMaker to detect and anonymize Personally Identifiable Information (PII) in text.

Amazon Sagemaker Data Anonymization Hugging Face Transformers Pii Detection Presidio

Philipp Schmid

5/17/2022 • EN

An Amazon SageMaker Inference comparison with Hugging Face Transformers

Compares Amazon SageMaker's four inference options for deploying Hugging Face Transformers models, covering latency, use cases, and pricing.

Amazon Sagemaker Hugging Face Inference Machine Learning Transformers

Philipp Schmid

5/3/2022 • EN

Semantic Segmantion with Hugging Face's Transformers and Amazon SageMaker

A technical guide on using Hugging Face's SegFormer model with Amazon SageMaker for semantic image segmentation tasks.

Amazon Sagemaker computer vision Image Segmentation Semantic Segmentation Transformers

Philipp Schmid

Amazon Sagemaker Articles

Llama 2 on Amazon SageMaker a Benchmark

Fine-tune Falcon 180B with QLoRA and Flash Attention on Amazon SageMaker

Deploy Falcon 180B on Amazon SageMaker

Deploy Llama 2 7B/13B/70B on Amazon SageMaker

Fine-tune LLaMA 2 (7-70B) on Amazon SageMaker

Train LLMs using QLoRA on Amazon SageMaker

Optimize and Deploy BERT on AWS inferentia2

Securely deploy LLMs inside VPCs with Hugging Face and Amazon SageMaker

Deploy Falcon 7B and 40B on Amazon SageMaker

Introducing the Hugging Face LLM Inference Container for Amazon SageMaker

Generative AI for Document Understanding with Hugging Face and Amazon SageMaker

How to scale LLM workloads to 20B+ with Amazon SageMaker using Hugging Face and PyTorch FSDP

Train and Deploy BLOOM with Amazon SageMaker and PEFT

Deploy FLAN-UL2 20B on Amazon SageMaker

Combine Amazon SageMaker and DeepSpeed to fine-tune FLAN-T5 XXL

Deploy FLAN-T5 XXL on Amazon SageMaker

Stable Diffusion on Amazon SageMaker

Advanced PII detection and anonymization with Hugging Face Transformers and Amazon SageMaker

An Amazon SageMaker Inference comparison with Hugging Face Transformers

Semantic Segmantion with Hugging Face's Transformers and Amazon SageMaker

Select Language

We use cookies