fix: switch to stable Gemini model and reduce rate limit pressure

Jing-yilin · claude · Jing-yilin · commit 9aae68a2f515 · 2026-03-01T11:59:31.000+08:00
Changed from gemini-2.0-flash-exp to gemini-1.5-flash-002:
- Experimental models have strict rate limits (quota exhausted errors)
- Stable model has higher quotas and better availability
- Reduced batch size from 10 to 5 campaigns
- Increased batch delay from 500ms to 2s

This prevents "Quota exceeded for generate_content_requests_per_minute" errors
during backfill operations.

Co-Authored-By: Claude Sonnet 4.5 &lt;noreply@anthropic.com&gt;
diff --git a/backend/internal/service/translator.go b/backend/internal/service/translator.go
@@ -59,12 +59,12 @@ func (t *TranslatorService) TranslateCampaigns(campaigns []model.Campaign) error
 		return nil
 	}
 
-	// Use Gemini 2.0 Flash via Vertex AI (uses startup credits)
-	model := t.client.GenerativeModel("gemini-2.0-flash-exp")
+	// Use Gemini 1.5 Flash (stable model with higher quotas than experimental)
+	model := t.client.GenerativeModel("gemini-1.5-flash-002")
 	model.SetTemperature(0.3) // Lower temperature for more consistent translations
 
-	// Batch translate in groups of 10 to avoid token limits
-	const batchSize = 10
+	// Batch translate in groups of 5 to stay within rate limits
+	const batchSize = 5
 	for i := 0; i < len(campaigns); i += batchSize {
 		end := i + batchSize
 		if end > len(campaigns) {
@@ -78,9 +78,9 @@ func (t *TranslatorService) TranslateCampaigns(campaigns []model.Campaign) error
 			continue
 		}
 
-		// Rate limiting: small delay between batches
+		// Rate limiting: 2-second delay between batches to avoid quota exhaustion
 		if end < len(campaigns) {
-			time.Sleep(500 * time.Millisecond)
+			time.Sleep(2 * time.Second)
 		}
 	}
 

Original file line number	Diff line number	Diff line change
`@@ -59,12 +59,12 @@ func (t *TranslatorService) TranslateCampaigns(campaigns []model.Campaign) error`
`59`	`59`	`return nil`
`60`	`60`	`}`
`61`	`61`
`62`		`- // Use Gemini 2.0 Flash via Vertex AI (uses startup credits)`
`63`		`- model := t.client.GenerativeModel("gemini-2.0-flash-exp")`
	`62`	`+ // Use Gemini 1.5 Flash (stable model with higher quotas than experimental)`
	`63`	`+ model := t.client.GenerativeModel("gemini-1.5-flash-002")`
`64`	`64`	`model.SetTemperature(0.3) // Lower temperature for more consistent translations`
`65`	`65`
`66`		`- // Batch translate in groups of 10 to avoid token limits`
`67`		`- const batchSize = 10`
	`66`	`+ // Batch translate in groups of 5 to stay within rate limits`
	`67`	`+ const batchSize = 5`
`68`	`68`	`for i := 0; i < len(campaigns); i += batchSize {`
`69`	`69`	`end := i + batchSize`
`70`	`70`	`if end > len(campaigns) {`
`@@ -78,9 +78,9 @@ func (t *TranslatorService) TranslateCampaigns(campaigns []model.Campaign) error`
`78`	`78`	`continue`
`79`	`79`	`}`
`80`	`80`
`81`		`- // Rate limiting: small delay between batches`
	`81`	`+ // Rate limiting: 2-second delay between batches to avoid quota exhaustion`
`82`	`82`	`if end < len(campaigns) {`
`83`		`- time.Sleep(500 * time.Millisecond)`
	`83`	`+ time.Sleep(2 * time.Second)`
`84`	`84`	`}`
`85`	`85`	`}`
`86`	`86`